SlideShare uma empresa Scribd logo
1 de 39
Baixar para ler offline
NOME DO PROFESSOR: Edson Rodrigues da Silva
COORDENADOR DE GESTÃO:
COORDENADOR GERAL DE GESTÃO PEDAGÓGICA:




        Processos Estatísticos de Pesquisa




Aluno(a):______________________________ Nº.___ Turma:__________Habilitação:____________

                                           1
1. CONCEITOS BÁSICOS

  •   População - é o conjunto de elementos (pessoas, coisas, objetos) que
      têm em comum uma característica em estudo. A população pode ser:

            i. Finita: quando apresenta um número limitado de indivíduos.
               Ex.1     a população constituída por todos os parafusos
               produzidos em uma fábrica em um dia.
               Ex. 2 nascimento de crianças em um dia em Novo Hamburgo.

            ii. Infinita: quando o número de observações for infinito.
                Ex. a população constituída de todos os resultados (cara e
                coroa) em sucessivos lances de uma moeda.

  •   Amostra - é o conjunto de elementos retirados da população,
      suficientemente representativos dessa população. Através da análise
      dessa amostra estaremos aptos para analisar os resultados da mesma
      forma que se estudássemos toda a população.


  Obs. A amostra é sempre finita. Quanto maior for a amostra mais
  significativa é o estudo.

  •   Parâmetro - é uma característica numérica estabelecida para toda
      uma população.

  •   Estimador - é uma característica numérica estabelecida para uma
      amostra.

  •   Dado Estatístico - é sempre um número real.

        a- Primitivo ou Bruto: é aquele que não sofreu nenhuma
           transformação matemática. Número direto.

        b- Elaborado ou secundário: é aquele que sofreu transformação
           matemática. Ex. porcentagem, média, etc.




                                  2
2. ARREDONDAMENTO DE DADOS

      •   Quando o primeiro algarismo após aquele que vai ser arredondado for 0,
          1, 2, 3 e 4 despreza-se este algarismo e conserva-se o anterior.

      Exemplo: 5,733958 = 5,73;              78,846970 = 78,8.

      •   Quando o primeiro algarismo após aquele que vai ser arredondado for
          5, 6, 7, 8 e 9 aumentamos uma unidade no algarismo anterior.

Exemplo: 5,735958 = 5,74;             78,886970 = 78,9.


   3. DIVISÃO DA ESTATÍSTICA

      Podemos dividir a Estatística em duas áreas:

          •   Estatística Descritiva – é à parte da Estatística que tem por objetivo
              descrever os dados observados e na sua função dos dados, tem as
              seguintes atribuições.

                   i. A obtenção ou coleta de dados – é normalmente feita
                      através de um questionário ou de observação direta de uma
                      população ou amostra.
                  ii. A organização dos dados – consiste na ordenação e crítica
                      quanto à correção dos valores observados, falhas humanas,
                      omissões, abandono de dados duvidosos.
                 iii. A representação dos dados – os dados estatísticos podem
                      ser mais facilmente compreendidos quando apresentados
                      através de tabelas e gráficos, que permite uma visualização
                      instantânea de todos os dados.
          •   Estatística Indutiva – é à parte da Estatística que tem por objetivo
              obter e generalizar conclusões para a população a partir de uma
              amostra, através do cálculo de probabilidade. A tais conclusões
              estão sempre associados a um grau de incerteza e
              conseqüentemente, a uma probabilidade de erro.




                                         3
4. VARIÁVEIS

            Uma variável é qualquer característica de um elemento observado
     (pessoa, objeto ou animal).
     Algumas variáveis, como sexo e designação de emprego, simplesmente
enquadram os indivíduos em categorias. Outras, como altura e renda anual,
tomam valores numéricos com os quais podemos fazer cálculos.

      Os exemplos acima nos dizem que uma variável pode ser:

     a – Qualitativa: quando seus valores são expressos por atributos: sexo
(masculino – feminino), cor da pele (branca, preta, amarela, vermelha);

       b – Quantitativa: quando seus valores são expressos em números
(salários dos operários, idade dos alunos de uma escola, número de filhos, etc.).
Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre
dois limites recebe o nome de variável contínua (altura, peso, etc.); uma variável
que só pode assumir valores pertencentes a um conjunto enumerável recebe o
nome de variável discreta (número de filhos, número de vitórias).

                                     Exercícios

   1. Classifique as variáveis abaixo:
   (a) Tempo para fazer um teste.
   (b) Número de alunos aprovados por turma.
   (c) Nível sócio-econômico
   (d) QI (Quociente de inteligência).
   (e) Sexo
   (f) Gastos com alimentação.
   (g) Opinião com relação à pena de morte
   (h) Religião
   (i) Valor de um imóvel
   (j) Conceitos em certa disciplina
   (k) Classificação em um concurso.

   2. Identifique e classifique as variáveis:
   a) Tabela de códigos de declaração de bens e direitos de imóveis: 11 –
      Apartamento; 12 - Casas; 13 – Terrenos; 14 – Terra nua; 15 – Salas ou
      lojas; 16 – Construção; 17 – Benfeitorias; 19 – Outras; (Declaração de
      Ajuste Anual, Instruções de Preenchimento, Imposto de Renda, Pessoa
      Física, 1999)

                                        4
b) “O euro começa a circular com 13 bilhões de notas em sete valores(5, 10,
   20, 50, 100, 200 e 500)...A cunhagem de 75 bilhões de moedas de 1 e 2
   euros e de 1, 2, 5, 10, 20 e 50 centavos de euro implicará uma troca
   completa de máquinas e equipamentos de venda de jornais,café e
   refrigerantes.” (Revista Época, Ano 1, nº 33 , 4/1/1999)

c) “Em sete deliciosos sabores: tangerina, Laranja, maracujá, lima-limão,
   carambola, abacaxi e maçã verde.” ( Anúncio de um preparado sólido
   artificial para refresco)


d) “ A partir de 1999, as declarações de Imposto de Renda dos contribuintes
   com patrimônio de até R$ 20 mil poderão ser feitas por telefone.” (Revista
   época, ano 1, nº 33, 4/1/1999)

e) Quantidade de sabores de refresco             consumida    em    determinado
   estabelecimento no fim de semana;


f) Em 28 de dezembro de 1998, a Folha de S. Paulo publicou a classificação
   dos prefeitos de nove capitais brasileiras. As notas, em uma escala de 0 a
   10, foram as seguintes: Curitiba 6,7; Recife, 6,5; Porto Alegre, 6,4;
   Florianópolis, 6,4; Salvador, 6,3; Fortaleza, 5,5; Belo Horizonte, 5,4; Rio de
   Janeiro, 5,4 e São Paulo,3,4.




                                      5
APRESENTAÇÃO DE DADOS ESTATÍSTICOS

   APRESENTAÇÃO TABULAR

       A apresentação de dados estatísticos na forma tabular consiste na reunião
ou grupamento dos dados em tabelas ou quadros com a finalidade de apresenta-
los de modo ordenado, simples e de fácil percepção e com economia de espaço.


         •  Componentes Básicos
            Em termos genéricos, uma tabela se compõe dos seguintes
      elementos básicos:
                          Título
                          Cabeçalho


                    Indicadora               C
                                             o
                        de          Casa      l   Linha
                                             u
                      Coluna                 n
                                             a

                 Rodapé

      Exemplo:
                      Brasil - Estimativa de População
                                1970 – 76
                            Ano            População
                                            (1000
                                         habitantes)
                          1970              93.139
                          1971              95.993
                          1972              98.690
                          1973             101.433
                          1974             104.243
                          1975             107.145
                          1976             110.124
          Fonte: Anuário Estatístico do Brasil



                                       6
•   Principais Elementos de uma Tabela

        Título: Conjunto de informações, as mais completas possíveis,
        localizado no topo da tabela, respondendo às perguntas: O quê? Onde?
        Quando?

        Cabeçalho: Parte superior da tabela que especifica o conteúdo das
        colunas.
     Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas.

         Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal,
     de dados que se inscrevem nos seus cruzamentos com as colunas.

         Casa ou Célula: Espaço destinado a um só número.

       Rodapé: são mencionadas a fonte se a série é extraída de alguma
publicação e também as notas ou chamadas que são esclarecimentos gerais ou
particulares relativos aos dados.




                                       7
SÉRIES ESTATÍSTICAS

       É toda tabela que apresenta a distribuição de um conjunto de dados
estatísticos em função de três elementos:
   a. Da época;
   b. Do local;
   c. Da espécie.

Esses elementos determinam o surgimento de quatro tipos fundamentais de
séries estatísticas:

   •   Séries Temporais ou Cronológicas: são aquelas nas quais os dados
       são reunidos segundo o tempo que varia, permanecendo fixos o local
       e a espécie.
       Exemplo:        Produção de petróleo bruto – Brasil
                                1966 – 1970.
                          Anos     Quantidade
                                      (cm³)
                          1966      6.748.889
                          1967      8.508.848
                          1968      9.509.639
                          1969     10.169.531
                          1970      9.685.641
                           Fonte Brasil em dados.

   •   Séries Geográficas: são aquelas nas quais os dados são reunidos
       segundo o local que varia permanecendo fixos o tempo e a espécie.
       Exemplo:              Rebanhos bovinos – Brasil
                                    1970.
                          Regiões     Bovinos (1000)
                            Norte          2.132
                          Nordeste        20.194
                          Sudeste         35.212
                             Sul          18.702
                        Centro-oeste      15.652
                         Fonte Brasil em dados.




                                 8
•   Séries Específicas: são aquelas nas quais os dados são reunidos
       segundo o espécie que varia permanecendo fixos o tempo e o local.
       Exemplo:             Produção pesqueira (mar) – Brasil
                                    1969.
                              Itens       Produção
                                            (ton.)
                             Peixes          314
                           Crustáceo          62
                                s
                           Moluscos           3
                           Mamíferos          12
                              Fonte Brasil em dados.

   •  Séries Composta ou Mista: é a combinação de dois ou mais
      fundamentais de séries estatísticas.
   Exemplo: Geográfica – Temporal.
      Evolução do transporte de carga marítima nas 4 principais bacias
                                 brasileiras
                            Brasil -1968– 1970.
                                              Anos
       Bacias
                        1968                 1969              1970
      Amazônica       233.768*             324.350           316.557
       Nordeste        16.873               20.272            20.246
         Prata        177.705              203.966           201.464
     São               53.142               48.667            57.948
    Francisco
   Fonte Brasil em dados.
   * Os dados estão em toneladas.

   A apresentação tabular de dados estatísticos é normalizada pela
resolução nº 886 de 26-10-1966 do Conselho Nacional de Estatística a fim
de uniformizar a apresentação de dados.

                               EXERCÍCIOS

Exercício 1: De acordo com o IBGE (1988), em 1986 ocorreram, em
acidentes de trânsito, 27306 casos de vítimas fatais, assim distribuídos:
11712 pedestres, 7116 passageiros e 8478 condutores. Faça uma tabela
para apresentar esses dados.



                                9
Exercício 2: De acordo com o Ministério dos transportes, em 1998, o
tamanho das malhas de transporte no Brasil é, assim distribuído: 320480
km de Rodovias (estradas municipais não estão incluídas), 29700 km de
Ferrovias (inclui as linhas de trens urbanos) e 40000 km de Hidrovias
(desse total, apenas 8000 km estão sendo usados de fato). Faça uma
tabela para apresentar esses dados.

Exercício 3: De acordo com Ministério da Educação a quantidade e alunos
matriculados no ensino de 1º grau no Brasil nos de 1990 a 1996 em
milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 –
22.473 – 23.564. Faça uma tabela para apresentar esses dados.

Exercício 4: Estabelecimentos de ensino da região norte do Brasil em
1982. A região norte subdivide-se em: Rondônia, Acre, Amazonas,
Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e 9
estabelecimentos de ensino, respectivamente, segundo o MEC. . Faça uma
tabela para apresentar esses dados.

Exercício 5: De acordo com o IBGE(1988), a distribuição dos suicídios
ocorridos no Brasil em 1986, segundo a causa atribuída, foi a seguinte: 263
por alcoolismo, 198 por dificuldade financeira, 700 por doença mental, 189
por outro tipo de doença, 416 por desilusão amorosa e 217 por outras
causas. Apresente essa distribuição em uma tabela.

Exercício 6: Muitos sistemas escolares fornecem o acesso a Internet para
seus estudantes hoje em dia. Desde 1996, o acesso À Internet foi facilitado
a 21.733 escolas elementares, 7.286 escolas do nível médio e 10.682
escolas de nível superior (Statistical Abstract of United States, 1997). Existe
nos Estados Unidos um total de 51.745 escolas elementares, 14.012
escolas do nível médio e 17.229 escolas do nível superior.

Exercício 7: A chance de uma campanha publicitária atingir sucesso a
ponto de ser comentada nas ruas e até incorporada ao vocabulário da
população é muito baixa. De acordo com estudos essa probabilidade se
altera de acordo com o meio de comunicação utilizado. Numa amostra de
30.000 campanhas publicitárias de Rádio (8mil), TV (10mil) e Rádio+TV
(12mil), verificou-se que, das 2800 que atingiram tal sucesso, 1200 foram
veiculadas no rádio e na TV e 500 apenas no rádio.

Exercício 8: Classifique as séries dos exercícios 1 até 5.



                                  10
DISTRIBUIÇÃO DE FREQUÊNCIA

      É o tipo de série estatística na qual permanece constante o fato, o local e a
época. Os dados são colocados em classes pré-estabelecidas, registrando
freqüência.
      Divide-se em duas partes:
      Distribuição de Freqüência Intervalar (Var. Contínua)
      Distribuição de Freqüência Pontual (Var. Discreta)

                    Distribuição de Freqüência Intervalar
      É um método de tabulação dos dados em classes, categorias ou intervalos,
onde teremos uma melhor visualização e aproveitamento dos dados.
      Exemplo:
                                 Notas do curso de
                    Ciência da Computação na disciplina de
                     Programação I de uma dada Faculdade
                              Notas        Nº de
                                        Estudantes
                              5 |-- 6       18
                              6 |-- 7       15
                              7 |-- 8       12
                              8 |-- 9       03
                             9 |--10        02
                                Elementos Principais:

a) Classe – é cada um dos intervalos em que os dados são agrupados.

b) Limites de classes são os valores extremos de cada classe.

li = limite inferior de uma classe;
Li = limite superior de uma classe.

c) Amplitude – é a diferença entre o maior valor e o menor valor de certo conjunto
de dados. Pode ser referida ao total de dados ou a uma das classes em particular.

      • Amplitude Total (At) – é calculada pela seguinte expressão:
      At = Max. (rol) – Min.(rol).


      •   Amplitude das classes (h) – é a relação entre a amplitude total e o
          número de classes, conforme mostra a expressão a seguir:

                                        11
Máx(rol ) − Mín.(rol )
          h=                          , onde n é o número de intervalos de classe.
                         n


d) Ponto médio de classe (xi) - é calculado pela seguinte expressão:
                                          L + li
                                     xi = i
                                            2
e) Freqüência absoluta (fi) - freqüência absoluta de uma classe de ordem i, é o
número de dados que pertencem a essa classe.

f) Freqüência relativa (fri) - freqüência relativa de uma classe de ordem i, é o
quociente da freqüência absoluta dessa classe (fi), pelo total, ou seja,
                                              fi
                                      fri =
                                            Total
Obs: a soma de todas as freqüências absolutas é igual ao total.

g) Freqüência acumulada (Fi) - freqüência acumulada de uma classe de ordem i, é
a soma das freqüências até a classe de ordem i.

h) Freqüência relativa acumulada (Fri) - freqüência relativa acumulada de uma
classe de ordem i, é a soma das freqüências relativas até a classe de ordem i.


         ORGANIZAÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA:

      Para organizar um conjunto de dados quantitativos em distribuição de
freqüências, aconselha-se seguir a seguinte orientação:

1o Organizar o rol – colocar os dados em ordem crescente ou ordem
decrescente.

2o Calcular (ou adotar) o número conveniente de classes – o número de classe
deve ser escolhido pelo pesquisador, em geral, convém estabelecer de 5 a 15
classes. Existem algumas fórmulas para estabelecer quantas classes devem ser
construídas. Nos usaremos,
n= N      onde N é a quantidade total de observações.

3o Calcular (ou adotar) a amplitude do intervalo de classes conveniente - a
amplitude do intervalo de classes deve ser o mesmo para todas as classes.


                                         12
Máx(rol ) − Mín.(rol )
       h=                          onde n é o número de intervalos de classe.
                      n

4o Obter os limites das classes – Usualmente as classes são intervalos abertos
á direita. Os limites são obtidos fazendo-se.
Limite inferior da 1a classe é igual ao mínimo do rol, isto é,

                                    l1 = Min.(rol)
Encontram-se os limites das classes, adicionando-se sucessivamente a amplitude
do intervalo de classes aos limites da 1a classe.

5o Obter as f i - contar o número de elementos do rol, que pertencem a cada
classe.

6o Apresentar a distribuição – construir uma tabela com título, subtítulo, ...

                       Distribuição de Freqüência Pontual
       É uma série de dados agrupados na qual o número de observações está
relacionados com um ponto real.
           Ex.: Notas do Aluno "X" na Disciplina de Estatística – 1990
                                 Nota Alunos
                                  6.3      2
                                  8.4      3
                                  5.3      2
                                  9.5      3
                                  6.5      5
                                 Total    15


                                  Exercícios
      1) Abaixo são relacionados os salários semanais (em Reais) de 60
operários de uma fábrica de sapatos.
                 110   120   125   136   145    150   165   172   180   185
                 110   120   125   140   145    155   165   172   180   190
                 115   120   130   140   145    158   168   175   180   190
                 115   120   130   140   147    158   168   175   180   195
                 117   120   130   140   150    160   170   175   180   195
                 117   123   135   142   150    163   170   178   185   198

     a) Construir uma distribuição de freqüências adequada.
     b) Interpretar os valores da terceira classe.

                                           13
2) Abaixo são relacionados às estaturas e os pesos de 25 alunos de
Estatística.
1.71 1.80 1.75 1.73 1.81               58    60     60    62    63
1.90 1.80 1.71 1.74 1.77               80    77     70    82    62
1.63 1.80 1.78 1.84 1.81               55    76     83    50    78
1.83 1.80 1.75 1.79 1.65               79    70     60    76    83
1.72 1.88 1.80 1.66 1.89               77    60     65    71    63



        Estaturas                                      Pesos




Construir uma distribuição de freqüências adequada para cada conjunto de dados.

3) Uma amostra de 20 operários de uma companhia apresentou os seguintes
salários recebidos durante uma certa semana, arredondados para o valor mais
próximo e apresentados em ordem crescente: 140, 140, 140, 140, 140, 140, 140,
140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Construir uma
distribuição de freqüências adequada.

   4) Complete os dados que faltam na distribuição de freqüência:


   a)
         Classes    xi      fi      Fi      fri (%)
         0 |-- 2    1       4       ...         4
         2 |-- 4    ...     8       ...        ...
         4 |-- 6    5      ...      30         18
           ...      7      27       ...        27
         8 |-- 10   ...    15       72         ...
        10 |-- 12   ...    ...      83         ...
           ...      13     10       93         10
        14 |-- 16   ...    ...      ...         7
          ∑                ...                 ....




                                          14
b)
        Salários        xi     fi    Fi
       500 |-- 700      600    8     8
           ...          800    20    ...
       900 |-- 1.100     ...   ...   35
     1.100 |-- 1.300     ...    5    40
     1.300 |-- 1.500   1.400   ...   ...
           ...           ...    1    43
     1.700 |-- 1.900   1.800   ...   ...
         Total                 44




                                     15
GRÁFICOS ESTATÍSTICOS

      O gráfico estatístico é uma forma de apresentação dos dados estatísticos,
cujo objetivo é o de produzir, no investigador ou no público em geral, uma
impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam
mais rápido à compreensão que as séries.

      A representação gráfica de um fenômeno deve obedecer a certos requisitos
fundamentais para ser realmente útil:
      a) Simplicidade – o gráfico deve ser destituído de detalhes de importância
         secundária, assim como de traços desnecessários que possam levar o
         observador a uma análise com erros.

      b) Clareza – o gráfico deve possibilitar uma correta interpretação dos
         valores representativos do fenômeno em estudo.


      c) Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em
         estudo.

                              Tipos de gráficos

Histograma, Polígono de Freqüência e Ogiva: São utilizados para representar a
distribuição de freqüência.
        Exemplo:
        Notas obtidas na disciplina de
            Programação I
           Notas      fi
           5 |-- 6   18
           6 |-- 7   15
           7 |-- 8   12
           8 |-- 9   03
           9 |--10   02
        FONTE: Dados hipotéticos.

      Ogiva ou polígono de freqüência acumulada:




                                      16
Exemplo:

   Gráfico em linha: é um dos mais importantes gráficos; representa observações
   feitas ao longo do tempo. Tais conjuntos de dados constituem as chamadas séries
   históricas ou temporais.
                                          EVOLUÇÃO DO DESEMPREGO NA
                                             GRANDE PORTO ALEGRE


                                     20
                           ÍNDICES




                                     10
                                     0
                                     1992       1994    1996     1998        2000
                                                        ANOS




   Gráfico em setores: É um gráfico construído no círculo, que é dividido em setores
   correspondentes aos termos da série e proporcionais aos valores numéricos dos
   termos da série. É mais utilizado para séries específicas ou geográficas com
   pequeno número de termos e quando se quer salientar a proporção de cada termo
   em relação ao todo.
   Exemplo:
                          ESPECIALIDADES MÉDICAS QUE MAIS SOFREM
                              PROCESSOS POR ERROS CIRÚRGICOS
                                       ANUALMENTE
                                                 Ginecologia e Obstetrícia
                                                            Cirurgia Plástica
                                                            Oftalmologia
                                                            Cirurgia Geral
                                                            Ortopedia
                                                            Pediatria
                                                            Outros



Gráficos em Barras (ou em colunas). É a representação de uma série por meio de
retângulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas).
Quando em barras, os retângulos têm a mesma altura e os comprimentos são
proporcionais aos respectivos dados.




                                                       17
GRUPOS GAÚCHOS MAIS LEMBRADOS


                                       Tchê Guri

                           Engenheiros do Hawai
                  GRUPOS




                               Tchê Barbaridade

                                     Os Serranos

                                   Tchê Garotos




                                                   0                5                 10         15
                                                                          ÍNDICE




      Quando em colunas, os retângulos têm a mesma base e as alturas são
proporcionais aos respectivos dados.
                                 O S D E Z E S T A D O S E M Q UE A C O LE T A D E LIX O UR B A N O É
                                    M A IS P R E C Á R IA - E M % D A P OP ULA ÇÃ O A T E N D ID A

                                                                                                 75     76
                                80                                                          71
                                                                               66,5    68
                                70                                      62
                                60                          51,5   55
                                                       48
                                50
                                40
                                         26,5
                                30
                                20
                                10
                                 0
                                         MA            PI   PA     TO   AP     AC      CE   AM   RR     BA
                                                                        EST A D OS




Cartograma. É representação sobre uma carta geográfica.
Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos
diretamente relacionados com as áreas geográficas ou políticas.




                                                                   18
Pictograma. Constitui um dos processos gráficos que melhor fala ao
público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação
gráfica consta de figuras.
                 Ex.: População Urbana do Brasil em 1980 (x 10)




                      Fonte: Anuário Estatístico (1984)

                                     19
LISTA DE EXERCÍCIOS

     1) Construir o Histograma, Polígono de Freqüência e a Ogiva das distribuições dos
     exercícios 1, 2 e 3 anteriores (pág. 11 e 12).

     2) Escolha o melhor tipo de gráfico para representar os vários tipos de séries.
a. Os dez Estados que fizeram maior número de             _______________________________
            Transplantes de rim em 98                       REGIÕES     PERCENTUAL
   _____________________________________                  _______________________________
    ESTADOS        Nº DE TRANSPLANTES                        NORTE          45,25
   _____________________________________                     NORDESTE       18,28
      DF                       34                            SUDESTE        10,85
      BA                       38                            SUL             6,76
      ES                        56                           CENTRO-OESTE 18,86
      PE                        56                        _______________________________
      CE                        87                        FONTE: IBGE
      PR                       181
      RJ                       181
      RS                       181
      MG                       231                   d.             COMÉRCIO EXTERIOR
      SP                        756                                   BRASIL - 1988/1993
    ___________________________________                               QUANTIDADE (1000 t)
     FONTE: Associação Brasileira de                 ANOS       EXPORTAÇÃO           IMPORTAÇÃO
Transplante                                           1988          169666                58085
     de Órgãos.
                                                      1989          177033                57293
                                                      1990          168095                57184
b.          O estado das florestas do planeta e o     1991          165974                63278
que foi devastado                                     1992         167295                  68059
            pela ocupação humana - em milhões         1993         182561                  77813
de km
                                                     FONTE: Ministério da Indústria, Comércio e
   CONTINENTE          ÁREA            ÁREA ATUAL    Turismo.
                    DESMATADA               DE
                                       FLORESTAS
   OCEANIA               0.5                0.9      e.        IMUNIZAÇÕES - DOSES APLICADAS
   ÁSIA                 10.8                4.3                     POR MUNICÍPIO - 1997
   ÁFRICA                4.5                2.3
   EUROPA                6.8                9.6      _______________________________________
   AMÉRICA DO            2.9                6.8           MUNICÍPIO       DOSES APLICADAS
   SUL
   AMÉRICA DO            3.2                9.4      _______________________________________
   NORTE E                                                ERECHIM                51215
   CENTRAL                                                NOVO HAMBURGO         110844
  FONTE: World Resources Institute                        PORTO ALEGRE           615317
                                                          RIO GRANDE              84997
                                                          SANTA MARIA           107701

                                                     ________________________________________
c.     ÁREA TERRESTRE DO BRASIL                         FONTE: Minstério da Saúde.




                                                20
MEDIDAS ESTATÍSTICAS

        Estudaremos dois tipos fundamentais de medidas estatísticas: medidas de
tendência central e medidas de dispersão.
        As medidas de tendência central mostram o valor representativo em torno
do qual os dados tendem a agrupar-se, com maior ou menor freqüência. São
utilizadas para sintetizar em um único número o conjunto de dados observados.
        As medidas de dispersão mostram o grau de afastamento dos valores
observados em relação àquele valor representativo.

                             MEDIDAS DE TENDÊNCIA CENTRAL

Medidas de Posição

Uma medida de posição é um valor calculado para um grupo de dados, e usado,
de alguma forma, para descrever dados. Tipicamente, deseja-se que o valor seja
representativo de todos os valores do grupo, o que significa, portanto, que
desejamos uma espécie de promédio. Do ponto de vista estatístico, um
“promédio” é uma medida de tendência central para uma série de valores.

Média Aritmética
A média aritmética é definida como a soma dos valores do grupo de dados
dividida pelo número de valores. É aplicada em escalas de valores, como notas,
pesos, estaturas etc. A média é um valor representativo de uma série de
números, a qual pode estar fazendo parte ou não dessa série.
As fórmulas são:
       n

      ∑X
      i =1
                  i
X=                          Para dados não tabulados da amostra
           n
       N

      ∑X
      i =1
                  i    fi
X =       N                 Para dados tabulados da amostra
        ∑  i =1
                  fi
Exemplos:
a) Média Aritmética para Dados não Tabulados:

Considere os seguintes valores de dados amostrais: {4, 5, 6, 7, 8}
       n

     ∑X
      i =1
                  i
                                  30
X=                        ∴X =       = 6,00           onde n é o tamanho da amostra
            n                      5
b) Média Aritmética para Dados Tabulados:

•   Para dados tabulados não agrupados em classes:

Exemplo:
Xi                fi               Xi*fi
4                 3                12
5                 4                20
6                 7                42
7                 5                35
8                 1                8
Total             20               117

Se forem provenientes de amostra, a fórmula é:
      N

     ∑X
      i =1
                  i       fi
                                      117
X=        N
                               ∴X =       = 5,85
                                       20
        ∑f i =1
                      i



•   Para dados tabulados não agrupados em classes:

Exemplo:
Classes           fi               Xi         Xi*fi
10 --| 20         3                15         45
20 --| 30         4                25         100
30 --| 40         7                35         245
40 --| 50         5                45         225
50 --| 60         1                55         55
Total             20               ---        670
Se forem provenientes de amostra, a fórmula é:
           N

       ∑X
       i =1
                       i       fi
                                               670
X=         N
                                     ∴X =          = 33,5
                                                20
           ∑f
           i =1
                           i




Média Geométrica

A média geométrica de n valores é definida, genericamente, como a raiz n-ésima
do produto de todos eles. A média geométrica pode ser simples ou ponderada,
conforme se utilize ou não em seu cálculo uma tabela de freqüências.
É aplicada a relações, taxas, índices etc.

a) Média Geométrica Simples:

Dados n valores x1, x2, x3,..., xn, a média geométrica desses valores será:
                                                                                               n
X g = n x1 * x2 * x3 * ... * xn                                   ou              Xg = n   ∏x
                                                                                           i =1
                                                                                                   i



Exemplo:

Calcular a média geométrica dos seguintes números:
X = { 10, 60, 360 }
Y = { 2, 2, 2, 2 }

No primeiro caso temos: x1 = 10, x2 = 60 e x3 = 360                                      n=3

                 n
Xg = n         ∏x ∴X
                i =1
                               i        g   = 3 x1 * x2 * x3 = 3 10 * 60 * 360 = 3 216.000 = 60



No segundo caso temos: y1 = 2, y2 = 2 e y3 = 2 e y4 = 2                                                n=4

                n
yg =   n
           ∏y  i =1
                           i       ∴ y g = 4 y1 * y2 * y3 * y4 = 4 2 * 2 * 2 * 2 = 4 2 4 = 2
b) Média Geométrica Ponderada

A média geométrica ponderada de um conjunto de números dispostos em uma
tabela de freqüências é calculada por intermédio da seguinte expressão:

                    k

                  ∑ fi
Xg =
                    j =i
                               x f1 1 * x f 2 2 * x f3 3 * ... * x f k n
ou
                    k

                  ∑ fi            k
Xg =                j =i
                               ∏x j =1
                                                 fi
                                                       j



Exemplo:
Calcular a média geométrica dos valores constantes da seguinte tabela:

xj                                         fj
1                                          2
3                                          4
9                                          2
27                                         1
                                                k

                                            ∑ fi           = 9
                                                j =i



              k

             ∑ fi          k
Xg =         j =i
                           ∏x
                           j =1
                                      fi
                                           j     = 9 12 * 3 4 * 9 2 * 27 1 = 9 1 * 81 * 81 * 27 = 9 177147 = 3,829554


Para comprovar este resultado, basta fazer:
(X ) g
         n
             = (3,829554) = 177.147
                                                      9
Mediana e Separatrizes

Mediana: É um tipo de separatriz que divide a curva em duas partes iguais de
50% cada (é o ponto central dos dados), e possui uma divisória. Para acharmos a
mediana, nosso primeiro passo é ordenar a série numérica:
Dados Brutos: {7, 6, 4, 3, 10}  Rol: {3, 4, 6, 7, 10}
Ordenada a série numérica, o próximo passo será calcular a posição da mediana.
O critério para encontrar a mediana (ou qualquer separatriz) se dá da seguinte
forma:
   • Se a posição calculada resultar em um número inteiro, separatriz desejada
       será uma média aritmética entre do número cuja posição foi calculada, com
       o número da posição imediatamente superior;

   •   Se a posição calculada resultar em um número não inteiro, a separatriz
       desejada será o número da posição imediatamente superior à posição
       calculada.


Caso de posições, calculadas onde o resultado é um número inteiro:

Dados Brutos: {7, 6, 4, 3}    Rol: {3, 4, 6, 7}
      4
PMd = = 2
      2
Como o resultado é um número inteiro, a mediana é a média entre o número da
posição calculada com o número da posição imediatamente superior. Logo:
       4 + 6 10
Md =        =   =5
         2    2

Caso de posições, calculadas onde o resultado não é um número inteiro:
Rol: {3, 4, 6, 7, 10} Há cinco números neste conjunto, logo a posição será:
       5
 PMd = = 2,5                PMd : Posição da mediana
       2
Como a posição calculada é um numero não inteiro (2,5), a serapatriz desejada
será o número da posição inteira imediatamente superior. Logo, a posição será 3
(três), e o terceiro número da série ordenada é 6. Então: Md = 6
Tercil: É um tipo de separatriz que divide a curva normal em três partes iguais de
33% cada - e possui duas divisórias, que são T1 e T2, significando
respectivamente: 1º tercil ou tercil inferior e 2º tercil ou tercil superior.

Quartil: É um tipo de separatriz que divide a curva normal em quatro áreas, por
partes iguais de 25% cada – e possui três divisórias, que são Q1, Q2 e Q3,
significando respectivamente, 1º quartil ou quartil inferior, 2º quartil ou quartil
médio e 3º quartil ou quartil superior.

Decil: É um tipo de separatriz que divide a curva normal em dez áreas iguais de
10% cada – e possui nove divisórias, as quais vão de D1 a D9, ou seja, 1º decil ao
9º decil.

Centil ou Precentil: É um tipo de separatriz que divide a curva normal em cem
áreas iguais de 1% cada – e possui noventa e nove divisórias, as quais vão de C1
(1º centil) a C99 (99º centil).
Simbologia:

Md:      Mediana
Tj :     Tercil na posição j
Qj :     Quartil na posição j
Dj :     Decil na posição j
Cj :     Centil na posição j
P:       Posição
li :     Limite inferior da classe cuja Fiab seja imediatamente superior a P.
Fiab :   Freqüência acumulada
Faa :    Freqüência acumulada anterior (trabalha-se na coluna de Fiab)
h:       Intervalo de classe
fi :     Freqüência simples

Exemplos de separatrizes numa distribuição de freqüência por classes de valores:

Considere a tabela abaixo, referente a idades dos alunos do Colégio X num dado
período:
Classes              fi    Fiab




10 --| 15            4     4
15 --| 20            109   113
20 --| 25            216   329
25 --| 30            209   538
30 --| 35            135   673
35 --| 40            78    751
40 --| 45            31    782
45 --| 50            16    798
50 --| 55            12    810
55 --| 60            3     813




Total                813

Mediana:

PMd =
      ∑ f i = 813 = 406,5
       2       2
                 ( P − Faa )
M d = li + h
                      fi
            ( 406,5 − 329)          (77,5)        387,5
M d = 25 + 5               = 25 + 5        = 25 +       = 25 + 1,85 = 26,85 anos
                 209                 209           209
Interpretação: 50% dos alunos possuem idades iguais ou inferiores a 26,85 anos.
Ou 50% dos alunos possuem idades iguais ou superiores a 26,85 anos.



1º Tercil:


PT1 =
        ∑f   i
                 =
                     813
                         = 271
        3             3
( P − Faa )
T2 = li + h
                 fi
            ( 271 − 113)          (158)        790
T1 = 20 + 5              = 20 + 5       = 20 +     = 20 + 3,66 = 23,66 anos
                 216               216         216
Interpretação: 33% dos alunos possuem idades iguais ou inferiores a 23,66 anos.
Ou 67% dos alunos possuem idades iguais ou superiores a 23,66 anos.

2º Tercil:


PT2 = 2 * ∑
                 fi          813
                      = 2*       = 2 * 271 = 542
           3                  3
                 ( P − Faa )
T2 = li + h
                      fi
               (542 − 538)
T2 = 30 + 5                = 30,15 anos
                  135

Interpretação: 67% dos alunos possuem idades iguais ou inferiores a 30,15 anos.
Ou 33% dos alunos possuem idades iguais ou superiores a 30,15 anos.




1º Quartil:


PQ1 = 1 *
            ∑f   i
                      =
                          813
                              = 203,25
             4             4
            ( P − Faa )
Q1 = l i + h
                 fi
            (203,25 − 113)
Q1 = 20 + 5                = 22,09 anos
                   216

Interpretação: 25% dos alunos possuem idades iguais ou inferiores a 22,09 anos.
Ou 75% dos alunos possuem idades iguais ou superiores a 22,09 anos.

3º Quartil:
PQ2 = 3 *
            ∑f   i     813
                     = 3*  = 609,75
            4           4
            ( P − Faa )
Q3 = li + h
                 fi
             (609,75 − 538)
Q3 = 30 + 5                   = 32,66 anos
                    135

Interpretação: 75% dos alunos possuem idades iguais ou inferiores a 32,66 anos.
Ou 25% dos alunos possuem idades iguais ou superiores a 32,66 anos.


Observações:

•   O resultado de ( P – Faa ) deverá ser sempre positivo;
•   A separatriz que estivermos trabalhando deverá ter o seu resultado dentro da
    classe respectiva;
•   Md = Q2 = D5 = C50



Moda

A moda é o ponto de maior concentração, isto é, o valor que ocorre com mais
freqüência.
Exemplo: Dados os conjuntos:
A = {4, 5, 6, 7, 8}             Amodal
B = {4, 5, 6, 6, 7, 8}          Modal              Mo = 6
C = {4, 5, 5, 6, 6, 7,8}        Bimodal            Mo = 5 e 6
D = {4, 5, 5, 6, 6, 7, 7, 8}    Trimodal           Mo = 5, 6 e 7
D = {4, 5, 5, 6, 6, 6, 7, 7, 8} Modal              Mo = 6
Em uma distribuição de freqüência por classes de valores, de uma forma bastante
simples, podemos encontrar a moda pela seguinte fórmula:
             h
M o = li +
             2
Sendo que a classe modal é aquela que apresentar maior freqüência.
Exemplo:
Na tabela anterior, utilizada para o exemplo de separatrizes, determine a moda:

Resolução:
Primeiro, procura-se a classe de maior freqüência, que é a classe 20 --| 25, a qual
apresenta freqüência 216. Depois, aplica-se a fórmula.
             5
M o = 20 +     = 20 + 2,5 = 22,5
             2

RESUMÃO
    A média aritmética simples

       A média aritmética simples de um conjunto de valores é o valor obtido
somando-se todos eles e dividindo-se o total pelo número de valores. É denotada
por x (leia-se “x barra”)

                          x=
                              ∑ x , onde x são os valores observados.
                               n

x=
    ∑ xi . f i , se os dados estiverem organizados em distribuição de freqüência.
     ∑ fi
Onde xi e fi são os valores do ponto médio e da freqüência absoluta da classe i-
ésima respectivamente.

Exemplos:
1º) Calcule a média aritmética dos valores abaixo:
    a. X = {0, 6, 8, 7, 4, 6}
    b. Y = {25, 16, 29, 19, 17}
    c. Z = {105, 123, 98, 140}


2º) Encontre a média para o salário destes funcionários.

   Salários semanais para 100 operários não especializados
   Salários       fi      xi     xi.fi
  semanais
  140 |-- 160    7
  160 |-- 180    20
  180 |-- 200    33
  200 |-- 220    25
  220 |-- 240    11
240 |-- 260      4
     ∑            100

      Exercícios:
      1) Encontre a média dos seguintes conjuntos de observações.
      a) X = {2, 3, 7, 8, 9}.              R: 5,8
      b) Y = {10, 15, 22, 18, 25, 16}.  R: 16,67
      c) Z = {1, 3, 6, 8}.                 R: 4,5
      d) T = {1, 3, 6, 100}.             R: 27,5

      2) Encontre a média das notas na disciplina de Programação I.
      Notas obtidas na disciplina de
           Programação I
          Notas     fi
          5 |-- 6  18
          6 |-- 7  15
          7 |-- 8  12
          8 |-- 9  03
          9 |--10  02

      FONTE: Dados hipotéticos.
      Resp 6,62.

                                      Mediana
   A mediana é um valor central de um rol, ou seja, a mediana de um conjunto de
valores ordenados (crescente ou decrescente) é a medida que divide este
conjunto em duas partes iguais.
   Exemplo: Calcule a mediana dos conjuntos abaixo:
   a- X={3, 7, 4, 12, 15, 10, 18, 14}
   b- Y={29, 33, 42, 38, 31, 34, 45, 51, 95}
   c- Z={29, 33, 42, 38, 31, 34, 45, 120, 95}


                                      Moda
      Seja X um conjunto de dados estatísticos. Define-se Moda de X, denotada
por Mo como sendo o elemento mais freqüente no conjunto.
      Um conjunto de dados pode ter:
         • Nenhuma moda (amodal);
         • Uma moda (unimodal);
         • Duas ou mais modas (multimodal).
Exercícios: Calcule a moda para os conjuntos abaixo:
      a) X= {2, 3, 4, 3, 7, 8, 9, 14}.
      b) Y= {2, 4, 6, 2, 8, 4, 10}.
      c) Z= {32, 56, 76, 4, 8, 97}.


      OBSERVAÇÕES:
      Não há regra para se dizer qual a melhor medida de tendência central. Em
cada situação específica o problema deve ser analisado pelo estatístico, que
concluirá pela medida mais adequada a situação. Assim é que:
      a)        A MA é a medida mais adequada quando não há valores erráticos
                ou aberrantes.
      b)        A mediana deve ser usada sempre que possível como medida
                representativa de distribuições com valores x 4,4 9,3 10,3 6,8
                dispersos, como distribuição de rendas, Md 4 8,5 10 6,5
                folhas de pagamentos, etc.                   Mo     6 5
      Exercícios:
      1) Dados os conjuntos abaixo, calcule a média aritmética, mediana e moda.
      A = {3, 5, 2, 1, 4, 7, 9}.
      B = {6, 12, 15, 7, 6, 10}.
      C = {10, 5, 11, 8, 15, 4, 16, 5, 20, 6, 13}.
      D = {4, 4, 10, 5, 8, 5, 10, 8}.

      2) Calcule a média aritmética das distribuições de freqüências dos
exercícios 1 e 2 das páginas 11. Resp. 1) R$ 151,79; 2) 173,53 cm e 68,15 kg.
Medidas de Dispersão
Caracterizar um conjunto de valores apenas através de uma média é descrevê-lo
inadequadamente, uma vez que os dados diferem entre si, em maior ou menor
grau. Logo, há necessidade de descrever tal conjunto por outra medida, a medida
de dispersão.

Amplitude
Embora a amplitude seja a medida de variabilidade mais fácil de calcular,
raramente é usada como única medida, pois não é tão boa quanto outras medidas
de variação que levam em conta todos os valores. O cálculo da amplitude se dá
com a diferença entre o maior e o menor valor de um conjunto de valores.
Sua fórmula é:
A = maior valor – menor valor

Desvio Quartílico
O desvio quartílico é uma medida de dispersão baseada nos quartis e calculado
como a média aritmética das diferenças entre a mediana e os dois quartis, sendo,
todavia, determinado mais facilmente como segue:

       Q3 − Q1
DQ =
          2

Desvio Médio
O desvio médio ou média dos desvios é igual à média aritmética dos valores
absolutos dos desvios tomadas em relação a uma das seguintes medidas de
tendência central: média ou mediana.
        n

       ∑x      i   −x
DM =   i =1
                              com a média (para dados não tabulados)
              n
        n

       ∑x      i     − Md
DM =   i =1
                              com a mediana (para dados não tabulados)
                   n
        n

       ∑x      i     − x fi
DM =   i =1
               n
                              com a média (para dados tabulados)
              ∑f
              i =1
                       i
n

       ∑x     i    − M d fi
DM =   i =1
                  n
                                         com a mediana (para dados tabulados)
              ∑f
              i =1
                          i




Desvio Padrão

Para dados não tabulados:

Seja o seguinte conjunto de números:
X= { x1, x2, x3, ..., xn}. O desvio padrão ou a média quadrática dos desvios ou
afastamento em relação à média aritmética desse conjunto será definida por:
        N                     N

       ∑d                     ∑ (x − µ )
               2                            2
              i                      i
σ =    i =1
                      =       i =1

       N              N
onde: di = ( xi − µ )

Desta forma, podemos escrever:
                 N  
                         2

                 ∑ xi  
       1  N 2  i =1  
σ=         ∑ xi − N 
       N  i =1
                          
         
                          
                           
Quando o desvio padrão representar uma descrição da amostra e não da
população, caso mais freqüênte em estatística, o denominador da expressão será
igual a n – 1, em vez de N. Logo:
                     N  
                             2

                     ∑ xi  
         1  N 2  i =1  
S=             ∑ xi − n 
       n − 1  i =1
                              
             
                              
                               


Desvio padrão para dados tabulados:

Quando os valores vierem dispostos em uma tabela de freqüências, o cálculo do
desvio padrão se fará através de uma das seguintes fórmulas:
z                z

        ∑ di2 fi         ∑ (x − µ )
                                            2
                                i               fi
σ =     i =1
            z
                     =   i =1
                                    z

         ∑f
          i =1
                 i              ∑f
                                i =1
                                        i




Logo:

                          z         
                                      2

                          ∑ xi f i  
            1  z 2
                    x f −  i =1z     
              ∑ i i
σ =       z                             
        ∑ fi  i =1            ∑ fi 
        i =1  
                              i =1     
                                        
e
                           z         
                                       2

                  z        ∑ xi f i  
         1        x 2 f −  i =1      
S=
      z
            
                   ∑i i           z
                                         
    ∑ f i  − 1  i =1         ∑ fi 
    i =1                    i =1     
                                         




Variância

A variância é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz
quadrada da variância. Dessa forma, pode-se dizer que a fórmula da variância é
igual à expressão do desvio padrão sem o sinal do radical. Temos, então:

              N  
                      2

              ∑ xi  
    1  N 2  i =1  
σ =
 2
        ∑ xi − N 
    N  i =1
                       
      
                       
                        
        N  
                          2

                  ∑ xi  
      1  N 2  i =1  
S =
 2
            ∑ xi − n 
    n − 1  i =1
                           
          
                           
                            

                         z         
                                        2

                         ∑ xi f i  
        1  z 2
                x f −  i =1z        
           ∑ i i
σ = z
 2
                                          
    ∑ fi  i =1             ∑ fi 
     i =1  
                            i =1         
                                          
                                  z
                                                  
                                                  2

                   z             ∑      xi f i  
          1        x 2 f −  i =1                
                  ∑ i i
S2 = z
                                      z
                                                    
     ∑ f i  − 1  i =1             ∑ fi 
     i =1       
                                     i =1          
                                                    

Exemplo 1:
     Encontre o desvio padrão para os dados das séries a), e b) acima.



Exemplo 2:
   Salários semanais para 100 operários não especializados
   Salários       fi      xi    (xi- x )2 (xi- x )2fi
  semanais
  140 |-- 160    7
  160 |-- 180    20
  180 |-- 200    33
  200 |-- 220    25
  220 |-- 240    11
  240 |-- 260    4
     ∑          100
Encontre o desvio padrão para o salário destes funcionários.

Exercício:
Calcule o desvio padrão das distribuições de freqüências dos exercícios 1 e 2 das
páginas 11 e 12.
Coeficiente de variação:
              Trata-se de uma medida de dispersão, útil para a compreensão em
      termos relativos do grau de concentração em torno da média de séries
      distintas. É dado por:
                                                σ
                                         Cv =       .100
                                                x
Exemplo 4:
       Para duas emissões de ações ordinárias da indústria eletrônica, o preço
médio diário, no fechamento dos negócios, durante um período de um mês, para
as ações A, foi de R$ 150,00 com um desvio padrão de R$ 5,00. Para as ações B,
o preço médio foi de R$ 50,00 com um desvio padrão de R$ 3,00. Em relação ao
nível do preço, qual dos tipos de ações é mais variável?

                                   Exercícios.
   1) Uma amostra de 20 operários de uma companhia apresentou os seguintes
      salários recebidos durante uma certa semana, arredondados para o valor
      mais próximo e apresentados em ordem crescente: 140, 140, 140, 140,
      140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230,
      240. Calcular (a) a média, (b) a mediana, (c) a moda, (d) o desvio padrão,
      (e) o coeficiente de variação, para este grupo de salários. R: a) 170,5; d)
      33,12.

   2) O número de carros vendidos por cada um dos vendedores de um negócio
      de automóveis durante um mês particular, em ordem crescente: 2, 4, 7, 10,
      10, 10, 12, 12, 14, 15. Determinar (a) a média, (b) a mediana, (c) a moda,
      (d) o desvio padrão R: a) 9,6; d) 3,95.

   3) Em conjunto com uma auditoria anual, uma firma de contabilidade pública
      anota o tempo necessário para realizar a auditoria de 50 balanços
      contábeis. Calcular (a) a média, (b) o desvio padrão, para o tempo de
      auditoria necessário para esta amostra de registro. R: a) 43,2; b)12,28.

   Tempo necessário para a auditoria de balanços contábeis.
          Tempo de auditoria. Nº de balanços.
                (min.)                (fi)
               10 |-- 20               3
               20 |-- 30               5
               30 |-- 40              10
               40 |-- 50              12
               50 |-- 60              20
                 Total                50
4) Os salários semanais de 50 funcionários de um hospital, em reais, foram os
seguintes:

              100 122 130 140 152 160 164 176 180 188 192 200 216
              104 126 134 146 156 160 170 176 184 190 194 200 218
              116 128 138 150 156 162 170 178 186 190 196 200
              120 128 140 150 156 162 176 180 186 192 196 210

a) Construa uma distribuição de freqüências, com h = 20 e limite inferior para a
primeira classe igual a 100.

b) Quantos funcionários tem um salário semanal situado entre R$ 120,00
(inclusive) e R$ 160,00 (exclusive)? 17 funcionários

c) Que porcentagem de funcionários tem um salário semanal situado entre R$
180,00 (inclusive) e R$ 200,00 (exclusive)?26%

d) Qual o salário médio semanal destes funcionários utilizando o item a)?166,4

e) Determine o desvio padrão e o coeficiente de variação da distribuição. 28,76;
17,28%

       5) A distribuição das alturas de um grupo de pessoas apresentou uma
altura média de 182 cm e um desvio padrão de 15 cm, enquanto que a distribuição
dos pesos, apresentou um peso médio de 78 kg, com um desvio padrão de 8 kg.
Qual das duas distribuições apresentou maior dispersão? Por quê?
Principais Índices Brasileiros:
IPC – Índice de Preços ao Consumidor
IPC/Fipe (São Paulo): É calculado com base em 4 conglomerados de,
aproximadamente, 300 endereços, sistematicamente pesquisados. A
ponderação é alterada sempre que ocorram mudanças significativas. São
pesquisados mais de 250 produtos, gerando cerca de 50.000 preços a
pesquisar. É calculado pela média geométrica dos relativos (Divisia) e
divulgado semanalmente.

ICV/Dieese (São Paulo): São utilizados aproximadamente 350 produtos,
pesquisados em famílias paulistanas com renda mensal entre 1 e 30 s.m.
(cesta de bens pesquisada em 1982/83).

INPC- Índice Nacional de Preços ao Consumidor: É calculado com base
nos preços de 11 regiões metropolitanas (São Paulo, Rio de Janeiro, Porto
Alegre, Belo Horizonte, Salvador, Recife, Belém, Fortaleza, Curitiba,
Goiânia e Brasília), num total de 116 municípios, em famílias com renda
entre 1 e 8 s.m. São utilizados, aproximadamente, 350 produtos e 140.000
preços a pesquisar. São obtidos índices regionais. O índice nacional é
obtido por ponderação dos regionais. O índice para produtos sazonais é
calculado por Paasche.

IPCA – Índice de Preços ao Consumidor Ampliado: Variante do INPC,
                     utiliza renda entre 1 e 40 s.m.
IPA – Índice de Preços por Atacado:
       Utiliza, aproximadamente, 430 produtos, totalizando cerca de 10.000
preços atualizados mensalmente. O cálculo do índice é feito por Laspeyres
com base móvel.
INCC – Índice Nacional da Construção Civil:
       É obtido com base nos preços e quantidades padrões consumidas na
construção de casas térreas (em média 82 m²) e edifícios com quatro, oito e
doze pavimentos. São considerados 427 itens de materiais de construção,
serviços e mão-de-obra.
IGP – Índice Geral de Preços:
       Calculado pela FGV - Fundação Getúlio Vargas, utiliza bens e
serviços, assim como os respectivos pesos, atualizados sistematicamente,
de acordo com o momento econômico. Utiliza a fórmula de Laspeyres de
base móvel. É a média ponderada do IPA (0,6), do IPC (0,3) e do INCC
(0,1).

Mais conteúdo relacionado

Mais procurados

Mais procurados (14)

Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º ano
 
Aula de Gráficos - Bioestatistica
Aula de Gráficos - BioestatisticaAula de Gráficos - Bioestatistica
Aula de Gráficos - Bioestatistica
 
Noções Básicas de Estatística
Noções Básicas de EstatísticaNoções Básicas de Estatística
Noções Básicas de Estatística
 
Apostila5 ine5102 quimica
Apostila5 ine5102 quimicaApostila5 ine5102 quimica
Apostila5 ine5102 quimica
 
Aula 2 resumo de dados
Aula 2   resumo de dadosAula 2   resumo de dados
Aula 2 resumo de dados
 
Estatistica conceitos
Estatistica conceitosEstatistica conceitos
Estatistica conceitos
 
Estatistica[1]
Estatistica[1]Estatistica[1]
Estatistica[1]
 
Cap3 - Apresentação De Dados
Cap3 - Apresentação De DadosCap3 - Apresentação De Dados
Cap3 - Apresentação De Dados
 
Como apresentar os seus dados em gráficos e tabelas
Como apresentar os seus dados em gráficos e tabelasComo apresentar os seus dados em gráficos e tabelas
Como apresentar os seus dados em gráficos e tabelas
 
Estatística
EstatísticaEstatística
Estatística
 
Pd de Matemática - Estátistica
Pd de Matemática - EstátisticaPd de Matemática - Estátistica
Pd de Matemática - Estátistica
 
Curso CDF - Revisão Enem - Matemática e suas tecnologias
Curso CDF - Revisão Enem - Matemática e suas tecnologiasCurso CDF - Revisão Enem - Matemática e suas tecnologias
Curso CDF - Revisão Enem - Matemática e suas tecnologias
 
Dados, tabelas e gráficos de barras
Dados, tabelas e gráficos de barrasDados, tabelas e gráficos de barras
Dados, tabelas e gráficos de barras
 
Noções de estatística 3º ano
Noções de estatística 3º anoNoções de estatística 3º ano
Noções de estatística 3º ano
 

Destaque (20)

Ecovolis I-Ad
Ecovolis I-AdEcovolis I-Ad
Ecovolis I-Ad
 
Indigenas
IndigenasIndigenas
Indigenas
 
Oenb iin niigem setgel zuin ilrex shinj
Oenb iin niigem setgel zuin ilrex shinjOenb iin niigem setgel zuin ilrex shinj
Oenb iin niigem setgel zuin ilrex shinj
 
Pdf output
Pdf outputPdf output
Pdf output
 
Tancament de bloc
Tancament de blocTancament de bloc
Tancament de bloc
 
Profile Lembaga
Profile LembagaProfile Lembaga
Profile Lembaga
 
презентация 6
презентация 6презентация 6
презентация 6
 
Alma
AlmaAlma
Alma
 
Propositos
PropositosPropositos
Propositos
 
Skin care
Skin careSkin care
Skin care
 
เครื่องใช้ไฟฟ้า ม.303
เครื่องใช้ไฟฟ้า ม.303เครื่องใช้ไฟฟ้า ม.303
เครื่องใช้ไฟฟ้า ม.303
 
Dif
DifDif
Dif
 
Aviso 5 separaciones
Aviso 5 separacionesAviso 5 separaciones
Aviso 5 separaciones
 
Presentació sobre globalització
Presentació sobre globalitzacióPresentació sobre globalització
Presentació sobre globalització
 
Tofla
ToflaTofla
Tofla
 
Case Qualità
Case QualitàCase Qualità
Case Qualità
 
DIPLOMADOS AREA ADMINISTRATIVA
DIPLOMADOS AREA ADMINISTRATIVADIPLOMADOS AREA ADMINISTRATIVA
DIPLOMADOS AREA ADMINISTRATIVA
 
Rup نظم
Rup نظم Rup نظم
Rup نظم
 
LW, MW & SW transmitter sites in Bulgaria
LW, MW & SW transmitter sites in BulgariaLW, MW & SW transmitter sites in Bulgaria
LW, MW & SW transmitter sites in Bulgaria
 
найди 10 животных
найди 10 животныхнайди 10 животных
найди 10 животных
 

Semelhante a Estatistica pep

Semelhante a Estatistica pep (20)

5127 apostila-de-estatistica
5127 apostila-de-estatistica5127 apostila-de-estatistica
5127 apostila-de-estatistica
 
Estatística
EstatísticaEstatística
Estatística
 
Estatística
EstatísticaEstatística
Estatística
 
Apos est i_fev04_c1
Apos est i_fev04_c1Apos est i_fev04_c1
Apos est i_fev04_c1
 
Aula bioestatistica
Aula bioestatisticaAula bioestatistica
Aula bioestatistica
 
EstatíStica Aula 000
EstatíStica Aula 000EstatíStica Aula 000
EstatíStica Aula 000
 
EstatisticaConceitos.pptx
EstatisticaConceitos.pptxEstatisticaConceitos.pptx
EstatisticaConceitos.pptx
 
Capítulo ii estatística iniciais
Capítulo ii   estatística  iniciaisCapítulo ii   estatística  iniciais
Capítulo ii estatística iniciais
 
Mat aula por aula v1
Mat aula por aula v1Mat aula por aula v1
Mat aula por aula v1
 
Ficha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaFicha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatistica
 
estatística
estatísticaestatística
estatística
 
Estatística
EstatísticaEstatística
Estatística
 
Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Material de apoio estatística 2017 1
Material de apoio estatística 2017 1
 
estatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencialestatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencial
 
Fundamentos da estatística
Fundamentos da estatísticaFundamentos da estatística
Fundamentos da estatística
 
Estatisticas petrobras
Estatisticas petrobrasEstatisticas petrobras
Estatisticas petrobras
 
Ou estatistica
Ou estatisticaOu estatistica
Ou estatistica
 
Apost estatistica
Apost estatistica Apost estatistica
Apost estatistica
 
Estatística completa
Estatística completaEstatística completa
Estatística completa
 
2oem 1mat_41b
2oem 1mat_41b2oem 1mat_41b
2oem 1mat_41b
 

Mais de simuladocontabil (20)

Contabilidade decifrada 10
Contabilidade decifrada 10Contabilidade decifrada 10
Contabilidade decifrada 10
 
Cb atividade1
Cb atividade1Cb atividade1
Cb atividade1
 
Dos produtos vendidos (cpv)
Dos produtos vendidos (cpv)Dos produtos vendidos (cpv)
Dos produtos vendidos (cpv)
 
Matematica rm triangulo retangulo
Matematica rm triangulo retanguloMatematica rm triangulo retangulo
Matematica rm triangulo retangulo
 
Gp impactos
Gp impactosGp impactos
Gp impactos
 
Contabilidade decifrada 05
Contabilidade decifrada 05Contabilidade decifrada 05
Contabilidade decifrada 05
 
Contabilidade basica peps ueps
Contabilidade basica peps uepsContabilidade basica peps ueps
Contabilidade basica peps ueps
 
Cetec ensino médio
Cetec ensino médioCetec ensino médio
Cetec ensino médio
 
Pfc tabela comparativa
Pfc tabela comparativaPfc tabela comparativa
Pfc tabela comparativa
 
Avaliação do ativo e passivo estoques
Avaliação do ativo e passivo estoquesAvaliação do ativo e passivo estoques
Avaliação do ativo e passivo estoques
 
Indices
IndicesIndices
Indices
 
Resumo ativo
Resumo ativoResumo ativo
Resumo ativo
 
Principios de contabilidade
Principios de contabilidadePrincipios de contabilidade
Principios de contabilidade
 
Patrimonio
PatrimonioPatrimonio
Patrimonio
 
Contabilidade decifrada 15
Contabilidade decifrada 15Contabilidade decifrada 15
Contabilidade decifrada 15
 
Ganhos e perdas
Ganhos e perdasGanhos e perdas
Ganhos e perdas
 
Apostila etec pfo
Apostila etec   pfoApostila etec   pfo
Apostila etec pfo
 
Contabilidade decifrada 09
Contabilidade decifrada 09Contabilidade decifrada 09
Contabilidade decifrada 09
 
Custo das mercadoria vendidas
Custo das mercadoria vendidasCusto das mercadoria vendidas
Custo das mercadoria vendidas
 
Encerramento do exercicio
Encerramento do exercicioEncerramento do exercicio
Encerramento do exercicio
 

Estatistica pep

  • 1. NOME DO PROFESSOR: Edson Rodrigues da Silva COORDENADOR DE GESTÃO: COORDENADOR GERAL DE GESTÃO PEDAGÓGICA: Processos Estatísticos de Pesquisa Aluno(a):______________________________ Nº.___ Turma:__________Habilitação:____________ 1
  • 2. 1. CONCEITOS BÁSICOS • População - é o conjunto de elementos (pessoas, coisas, objetos) que têm em comum uma característica em estudo. A população pode ser: i. Finita: quando apresenta um número limitado de indivíduos. Ex.1 a população constituída por todos os parafusos produzidos em uma fábrica em um dia. Ex. 2 nascimento de crianças em um dia em Novo Hamburgo. ii. Infinita: quando o número de observações for infinito. Ex. a população constituída de todos os resultados (cara e coroa) em sucessivos lances de uma moeda. • Amostra - é o conjunto de elementos retirados da população, suficientemente representativos dessa população. Através da análise dessa amostra estaremos aptos para analisar os resultados da mesma forma que se estudássemos toda a população. Obs. A amostra é sempre finita. Quanto maior for a amostra mais significativa é o estudo. • Parâmetro - é uma característica numérica estabelecida para toda uma população. • Estimador - é uma característica numérica estabelecida para uma amostra. • Dado Estatístico - é sempre um número real. a- Primitivo ou Bruto: é aquele que não sofreu nenhuma transformação matemática. Número direto. b- Elaborado ou secundário: é aquele que sofreu transformação matemática. Ex. porcentagem, média, etc. 2
  • 3. 2. ARREDONDAMENTO DE DADOS • Quando o primeiro algarismo após aquele que vai ser arredondado for 0, 1, 2, 3 e 4 despreza-se este algarismo e conserva-se o anterior. Exemplo: 5,733958 = 5,73; 78,846970 = 78,8. • Quando o primeiro algarismo após aquele que vai ser arredondado for 5, 6, 7, 8 e 9 aumentamos uma unidade no algarismo anterior. Exemplo: 5,735958 = 5,74; 78,886970 = 78,9. 3. DIVISÃO DA ESTATÍSTICA Podemos dividir a Estatística em duas áreas: • Estatística Descritiva – é à parte da Estatística que tem por objetivo descrever os dados observados e na sua função dos dados, tem as seguintes atribuições. i. A obtenção ou coleta de dados – é normalmente feita através de um questionário ou de observação direta de uma população ou amostra. ii. A organização dos dados – consiste na ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos. iii. A representação dos dados – os dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de tabelas e gráficos, que permite uma visualização instantânea de todos os dados. • Estatística Indutiva – é à parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. A tais conclusões estão sempre associados a um grau de incerteza e conseqüentemente, a uma probabilidade de erro. 3
  • 4. 4. VARIÁVEIS Uma variável é qualquer característica de um elemento observado (pessoa, objeto ou animal). Algumas variáveis, como sexo e designação de emprego, simplesmente enquadram os indivíduos em categorias. Outras, como altura e renda anual, tomam valores numéricos com os quais podemos fazer cálculos. Os exemplos acima nos dizem que uma variável pode ser: a – Qualitativa: quando seus valores são expressos por atributos: sexo (masculino – feminino), cor da pele (branca, preta, amarela, vermelha); b – Quantitativa: quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola, número de filhos, etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua (altura, peso, etc.); uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta (número de filhos, número de vitórias). Exercícios 1. Classifique as variáveis abaixo: (a) Tempo para fazer um teste. (b) Número de alunos aprovados por turma. (c) Nível sócio-econômico (d) QI (Quociente de inteligência). (e) Sexo (f) Gastos com alimentação. (g) Opinião com relação à pena de morte (h) Religião (i) Valor de um imóvel (j) Conceitos em certa disciplina (k) Classificação em um concurso. 2. Identifique e classifique as variáveis: a) Tabela de códigos de declaração de bens e direitos de imóveis: 11 – Apartamento; 12 - Casas; 13 – Terrenos; 14 – Terra nua; 15 – Salas ou lojas; 16 – Construção; 17 – Benfeitorias; 19 – Outras; (Declaração de Ajuste Anual, Instruções de Preenchimento, Imposto de Renda, Pessoa Física, 1999) 4
  • 5. b) “O euro começa a circular com 13 bilhões de notas em sete valores(5, 10, 20, 50, 100, 200 e 500)...A cunhagem de 75 bilhões de moedas de 1 e 2 euros e de 1, 2, 5, 10, 20 e 50 centavos de euro implicará uma troca completa de máquinas e equipamentos de venda de jornais,café e refrigerantes.” (Revista Época, Ano 1, nº 33 , 4/1/1999) c) “Em sete deliciosos sabores: tangerina, Laranja, maracujá, lima-limão, carambola, abacaxi e maçã verde.” ( Anúncio de um preparado sólido artificial para refresco) d) “ A partir de 1999, as declarações de Imposto de Renda dos contribuintes com patrimônio de até R$ 20 mil poderão ser feitas por telefone.” (Revista época, ano 1, nº 33, 4/1/1999) e) Quantidade de sabores de refresco consumida em determinado estabelecimento no fim de semana; f) Em 28 de dezembro de 1998, a Folha de S. Paulo publicou a classificação dos prefeitos de nove capitais brasileiras. As notas, em uma escala de 0 a 10, foram as seguintes: Curitiba 6,7; Recife, 6,5; Porto Alegre, 6,4; Florianópolis, 6,4; Salvador, 6,3; Fortaleza, 5,5; Belo Horizonte, 5,4; Rio de Janeiro, 5,4 e São Paulo,3,4. 5
  • 6. APRESENTAÇÃO DE DADOS ESTATÍSTICOS APRESENTAÇÃO TABULAR A apresentação de dados estatísticos na forma tabular consiste na reunião ou grupamento dos dados em tabelas ou quadros com a finalidade de apresenta- los de modo ordenado, simples e de fácil percepção e com economia de espaço. • Componentes Básicos Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos: Título Cabeçalho Indicadora C o de Casa l Linha u Coluna n a Rodapé Exemplo: Brasil - Estimativa de População 1970 – 76 Ano População (1000 habitantes) 1970 93.139 1971 95.993 1972 98.690 1973 101.433 1974 104.243 1975 107.145 1976 110.124 Fonte: Anuário Estatístico do Brasil 6
  • 7. Principais Elementos de uma Tabela Título: Conjunto de informações, as mais completas possíveis, localizado no topo da tabela, respondendo às perguntas: O quê? Onde? Quando? Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas. Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas. Casa ou Célula: Espaço destinado a um só número. Rodapé: são mencionadas a fonte se a série é extraída de alguma publicação e também as notas ou chamadas que são esclarecimentos gerais ou particulares relativos aos dados. 7
  • 8. SÉRIES ESTATÍSTICAS É toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função de três elementos: a. Da época; b. Do local; c. Da espécie. Esses elementos determinam o surgimento de quatro tipos fundamentais de séries estatísticas: • Séries Temporais ou Cronológicas: são aquelas nas quais os dados são reunidos segundo o tempo que varia, permanecendo fixos o local e a espécie. Exemplo: Produção de petróleo bruto – Brasil 1966 – 1970. Anos Quantidade (cm³) 1966 6.748.889 1967 8.508.848 1968 9.509.639 1969 10.169.531 1970 9.685.641 Fonte Brasil em dados. • Séries Geográficas: são aquelas nas quais os dados são reunidos segundo o local que varia permanecendo fixos o tempo e a espécie. Exemplo: Rebanhos bovinos – Brasil 1970. Regiões Bovinos (1000) Norte 2.132 Nordeste 20.194 Sudeste 35.212 Sul 18.702 Centro-oeste 15.652 Fonte Brasil em dados. 8
  • 9. Séries Específicas: são aquelas nas quais os dados são reunidos segundo o espécie que varia permanecendo fixos o tempo e o local. Exemplo: Produção pesqueira (mar) – Brasil 1969. Itens Produção (ton.) Peixes 314 Crustáceo 62 s Moluscos 3 Mamíferos 12 Fonte Brasil em dados. • Séries Composta ou Mista: é a combinação de dois ou mais fundamentais de séries estatísticas. Exemplo: Geográfica – Temporal. Evolução do transporte de carga marítima nas 4 principais bacias brasileiras Brasil -1968– 1970. Anos Bacias 1968 1969 1970 Amazônica 233.768* 324.350 316.557 Nordeste 16.873 20.272 20.246 Prata 177.705 203.966 201.464 São 53.142 48.667 57.948 Francisco Fonte Brasil em dados. * Os dados estão em toneladas. A apresentação tabular de dados estatísticos é normalizada pela resolução nº 886 de 26-10-1966 do Conselho Nacional de Estatística a fim de uniformizar a apresentação de dados. EXERCÍCIOS Exercício 1: De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsito, 27306 casos de vítimas fatais, assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores. Faça uma tabela para apresentar esses dados. 9
  • 10. Exercício 2: De acordo com o Ministério dos transportes, em 1998, o tamanho das malhas de transporte no Brasil é, assim distribuído: 320480 km de Rodovias (estradas municipais não estão incluídas), 29700 km de Ferrovias (inclui as linhas de trens urbanos) e 40000 km de Hidrovias (desse total, apenas 8000 km estão sendo usados de fato). Faça uma tabela para apresentar esses dados. Exercício 3: De acordo com Ministério da Educação a quantidade e alunos matriculados no ensino de 1º grau no Brasil nos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564. Faça uma tabela para apresentar esses dados. Exercício 4: Estabelecimentos de ensino da região norte do Brasil em 1982. A região norte subdivide-se em: Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de ensino, respectivamente, segundo o MEC. . Faça uma tabela para apresentar esses dados. Exercício 5: De acordo com o IBGE(1988), a distribuição dos suicídios ocorridos no Brasil em 1986, segundo a causa atribuída, foi a seguinte: 263 por alcoolismo, 198 por dificuldade financeira, 700 por doença mental, 189 por outro tipo de doença, 416 por desilusão amorosa e 217 por outras causas. Apresente essa distribuição em uma tabela. Exercício 6: Muitos sistemas escolares fornecem o acesso a Internet para seus estudantes hoje em dia. Desde 1996, o acesso À Internet foi facilitado a 21.733 escolas elementares, 7.286 escolas do nível médio e 10.682 escolas de nível superior (Statistical Abstract of United States, 1997). Existe nos Estados Unidos um total de 51.745 escolas elementares, 14.012 escolas do nível médio e 17.229 escolas do nível superior. Exercício 7: A chance de uma campanha publicitária atingir sucesso a ponto de ser comentada nas ruas e até incorporada ao vocabulário da população é muito baixa. De acordo com estudos essa probabilidade se altera de acordo com o meio de comunicação utilizado. Numa amostra de 30.000 campanhas publicitárias de Rádio (8mil), TV (10mil) e Rádio+TV (12mil), verificou-se que, das 2800 que atingiram tal sucesso, 1200 foram veiculadas no rádio e na TV e 500 apenas no rádio. Exercício 8: Classifique as séries dos exercícios 1 até 5. 10
  • 11. DISTRIBUIÇÃO DE FREQUÊNCIA É o tipo de série estatística na qual permanece constante o fato, o local e a época. Os dados são colocados em classes pré-estabelecidas, registrando freqüência. Divide-se em duas partes: Distribuição de Freqüência Intervalar (Var. Contínua) Distribuição de Freqüência Pontual (Var. Discreta) Distribuição de Freqüência Intervalar É um método de tabulação dos dados em classes, categorias ou intervalos, onde teremos uma melhor visualização e aproveitamento dos dados. Exemplo: Notas do curso de Ciência da Computação na disciplina de Programação I de uma dada Faculdade Notas Nº de Estudantes 5 |-- 6 18 6 |-- 7 15 7 |-- 8 12 8 |-- 9 03 9 |--10 02 Elementos Principais: a) Classe – é cada um dos intervalos em que os dados são agrupados. b) Limites de classes são os valores extremos de cada classe. li = limite inferior de uma classe; Li = limite superior de uma classe. c) Amplitude – é a diferença entre o maior valor e o menor valor de certo conjunto de dados. Pode ser referida ao total de dados ou a uma das classes em particular. • Amplitude Total (At) – é calculada pela seguinte expressão: At = Max. (rol) – Min.(rol). • Amplitude das classes (h) – é a relação entre a amplitude total e o número de classes, conforme mostra a expressão a seguir: 11
  • 12. Máx(rol ) − Mín.(rol ) h= , onde n é o número de intervalos de classe. n d) Ponto médio de classe (xi) - é calculado pela seguinte expressão: L + li xi = i 2 e) Freqüência absoluta (fi) - freqüência absoluta de uma classe de ordem i, é o número de dados que pertencem a essa classe. f) Freqüência relativa (fri) - freqüência relativa de uma classe de ordem i, é o quociente da freqüência absoluta dessa classe (fi), pelo total, ou seja, fi fri = Total Obs: a soma de todas as freqüências absolutas é igual ao total. g) Freqüência acumulada (Fi) - freqüência acumulada de uma classe de ordem i, é a soma das freqüências até a classe de ordem i. h) Freqüência relativa acumulada (Fri) - freqüência relativa acumulada de uma classe de ordem i, é a soma das freqüências relativas até a classe de ordem i. ORGANIZAÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA: Para organizar um conjunto de dados quantitativos em distribuição de freqüências, aconselha-se seguir a seguinte orientação: 1o Organizar o rol – colocar os dados em ordem crescente ou ordem decrescente. 2o Calcular (ou adotar) o número conveniente de classes – o número de classe deve ser escolhido pelo pesquisador, em geral, convém estabelecer de 5 a 15 classes. Existem algumas fórmulas para estabelecer quantas classes devem ser construídas. Nos usaremos, n= N onde N é a quantidade total de observações. 3o Calcular (ou adotar) a amplitude do intervalo de classes conveniente - a amplitude do intervalo de classes deve ser o mesmo para todas as classes. 12
  • 13. Máx(rol ) − Mín.(rol ) h= onde n é o número de intervalos de classe. n 4o Obter os limites das classes – Usualmente as classes são intervalos abertos á direita. Os limites são obtidos fazendo-se. Limite inferior da 1a classe é igual ao mínimo do rol, isto é, l1 = Min.(rol) Encontram-se os limites das classes, adicionando-se sucessivamente a amplitude do intervalo de classes aos limites da 1a classe. 5o Obter as f i - contar o número de elementos do rol, que pertencem a cada classe. 6o Apresentar a distribuição – construir uma tabela com título, subtítulo, ... Distribuição de Freqüência Pontual É uma série de dados agrupados na qual o número de observações está relacionados com um ponto real. Ex.: Notas do Aluno "X" na Disciplina de Estatística – 1990 Nota Alunos 6.3 2 8.4 3 5.3 2 9.5 3 6.5 5 Total 15 Exercícios 1) Abaixo são relacionados os salários semanais (em Reais) de 60 operários de uma fábrica de sapatos. 110 120 125 136 145 150 165 172 180 185 110 120 125 140 145 155 165 172 180 190 115 120 130 140 145 158 168 175 180 190 115 120 130 140 147 158 168 175 180 195 117 120 130 140 150 160 170 175 180 195 117 123 135 142 150 163 170 178 185 198 a) Construir uma distribuição de freqüências adequada. b) Interpretar os valores da terceira classe. 13
  • 14. 2) Abaixo são relacionados às estaturas e os pesos de 25 alunos de Estatística. 1.71 1.80 1.75 1.73 1.81 58 60 60 62 63 1.90 1.80 1.71 1.74 1.77 80 77 70 82 62 1.63 1.80 1.78 1.84 1.81 55 76 83 50 78 1.83 1.80 1.75 1.79 1.65 79 70 60 76 83 1.72 1.88 1.80 1.66 1.89 77 60 65 71 63 Estaturas Pesos Construir uma distribuição de freqüências adequada para cada conjunto de dados. 3) Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma certa semana, arredondados para o valor mais próximo e apresentados em ordem crescente: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Construir uma distribuição de freqüências adequada. 4) Complete os dados que faltam na distribuição de freqüência: a) Classes xi fi Fi fri (%) 0 |-- 2 1 4 ... 4 2 |-- 4 ... 8 ... ... 4 |-- 6 5 ... 30 18 ... 7 27 ... 27 8 |-- 10 ... 15 72 ... 10 |-- 12 ... ... 83 ... ... 13 10 93 10 14 |-- 16 ... ... ... 7 ∑ ... .... 14
  • 15. b) Salários xi fi Fi 500 |-- 700 600 8 8 ... 800 20 ... 900 |-- 1.100 ... ... 35 1.100 |-- 1.300 ... 5 40 1.300 |-- 1.500 1.400 ... ... ... ... 1 43 1.700 |-- 1.900 1.800 ... ... Total 44 15
  • 16. GRÁFICOS ESTATÍSTICOS O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil: a) Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise com erros. b) Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. c) Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo. Tipos de gráficos Histograma, Polígono de Freqüência e Ogiva: São utilizados para representar a distribuição de freqüência. Exemplo: Notas obtidas na disciplina de Programação I Notas fi 5 |-- 6 18 6 |-- 7 15 7 |-- 8 12 8 |-- 9 03 9 |--10 02 FONTE: Dados hipotéticos. Ogiva ou polígono de freqüência acumulada: 16
  • 17. Exemplo: Gráfico em linha: é um dos mais importantes gráficos; representa observações feitas ao longo do tempo. Tais conjuntos de dados constituem as chamadas séries históricas ou temporais. EVOLUÇÃO DO DESEMPREGO NA GRANDE PORTO ALEGRE 20 ÍNDICES 10 0 1992 1994 1996 1998 2000 ANOS Gráfico em setores: É um gráfico construído no círculo, que é dividido em setores correspondentes aos termos da série e proporcionais aos valores numéricos dos termos da série. É mais utilizado para séries específicas ou geográficas com pequeno número de termos e quando se quer salientar a proporção de cada termo em relação ao todo. Exemplo: ESPECIALIDADES MÉDICAS QUE MAIS SOFREM PROCESSOS POR ERROS CIRÚRGICOS ANUALMENTE Ginecologia e Obstetrícia Cirurgia Plástica Oftalmologia Cirurgia Geral Ortopedia Pediatria Outros Gráficos em Barras (ou em colunas). É a representação de uma série por meio de retângulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas). Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. 17
  • 18. GRUPOS GAÚCHOS MAIS LEMBRADOS Tchê Guri Engenheiros do Hawai GRUPOS Tchê Barbaridade Os Serranos Tchê Garotos 0 5 10 15 ÍNDICE Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. O S D E Z E S T A D O S E M Q UE A C O LE T A D E LIX O UR B A N O É M A IS P R E C Á R IA - E M % D A P OP ULA ÇÃ O A T E N D ID A 75 76 80 71 66,5 68 70 62 60 51,5 55 48 50 40 26,5 30 20 10 0 MA PI PA TO AP AC CE AM RR BA EST A D OS Cartograma. É representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com as áreas geográficas ou políticas. 18
  • 19. Pictograma. Constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. Ex.: População Urbana do Brasil em 1980 (x 10) Fonte: Anuário Estatístico (1984) 19
  • 20. LISTA DE EXERCÍCIOS 1) Construir o Histograma, Polígono de Freqüência e a Ogiva das distribuições dos exercícios 1, 2 e 3 anteriores (pág. 11 e 12). 2) Escolha o melhor tipo de gráfico para representar os vários tipos de séries. a. Os dez Estados que fizeram maior número de _______________________________ Transplantes de rim em 98 REGIÕES PERCENTUAL _____________________________________ _______________________________ ESTADOS Nº DE TRANSPLANTES NORTE 45,25 _____________________________________ NORDESTE 18,28 DF 34 SUDESTE 10,85 BA 38 SUL 6,76 ES 56 CENTRO-OESTE 18,86 PE 56 _______________________________ CE 87 FONTE: IBGE PR 181 RJ 181 RS 181 MG 231 d. COMÉRCIO EXTERIOR SP 756 BRASIL - 1988/1993 ___________________________________ QUANTIDADE (1000 t) FONTE: Associação Brasileira de ANOS EXPORTAÇÃO IMPORTAÇÃO Transplante 1988 169666 58085 de Órgãos. 1989 177033 57293 1990 168095 57184 b. O estado das florestas do planeta e o 1991 165974 63278 que foi devastado 1992 167295 68059 pela ocupação humana - em milhões 1993 182561 77813 de km FONTE: Ministério da Indústria, Comércio e CONTINENTE ÁREA ÁREA ATUAL Turismo. DESMATADA DE FLORESTAS OCEANIA 0.5 0.9 e. IMUNIZAÇÕES - DOSES APLICADAS ÁSIA 10.8 4.3 POR MUNICÍPIO - 1997 ÁFRICA 4.5 2.3 EUROPA 6.8 9.6 _______________________________________ AMÉRICA DO 2.9 6.8 MUNICÍPIO DOSES APLICADAS SUL AMÉRICA DO 3.2 9.4 _______________________________________ NORTE E ERECHIM 51215 CENTRAL NOVO HAMBURGO 110844 FONTE: World Resources Institute PORTO ALEGRE 615317 RIO GRANDE 84997 SANTA MARIA 107701 ________________________________________ c. ÁREA TERRESTRE DO BRASIL FONTE: Minstério da Saúde. 20
  • 21. MEDIDAS ESTATÍSTICAS Estudaremos dois tipos fundamentais de medidas estatísticas: medidas de tendência central e medidas de dispersão. As medidas de tendência central mostram o valor representativo em torno do qual os dados tendem a agrupar-se, com maior ou menor freqüência. São utilizadas para sintetizar em um único número o conjunto de dados observados. As medidas de dispersão mostram o grau de afastamento dos valores observados em relação àquele valor representativo. MEDIDAS DE TENDÊNCIA CENTRAL Medidas de Posição Uma medida de posição é um valor calculado para um grupo de dados, e usado, de alguma forma, para descrever dados. Tipicamente, deseja-se que o valor seja representativo de todos os valores do grupo, o que significa, portanto, que desejamos uma espécie de promédio. Do ponto de vista estatístico, um “promédio” é uma medida de tendência central para uma série de valores. Média Aritmética A média aritmética é definida como a soma dos valores do grupo de dados dividida pelo número de valores. É aplicada em escalas de valores, como notas, pesos, estaturas etc. A média é um valor representativo de uma série de números, a qual pode estar fazendo parte ou não dessa série. As fórmulas são: n ∑X i =1 i X= Para dados não tabulados da amostra n N ∑X i =1 i fi X = N Para dados tabulados da amostra ∑ i =1 fi
  • 22. Exemplos: a) Média Aritmética para Dados não Tabulados: Considere os seguintes valores de dados amostrais: {4, 5, 6, 7, 8} n ∑X i =1 i 30 X= ∴X = = 6,00 onde n é o tamanho da amostra n 5 b) Média Aritmética para Dados Tabulados: • Para dados tabulados não agrupados em classes: Exemplo: Xi fi Xi*fi 4 3 12 5 4 20 6 7 42 7 5 35 8 1 8 Total 20 117 Se forem provenientes de amostra, a fórmula é: N ∑X i =1 i fi 117 X= N ∴X = = 5,85 20 ∑f i =1 i • Para dados tabulados não agrupados em classes: Exemplo: Classes fi Xi Xi*fi 10 --| 20 3 15 45 20 --| 30 4 25 100 30 --| 40 7 35 245 40 --| 50 5 45 225 50 --| 60 1 55 55 Total 20 --- 670
  • 23. Se forem provenientes de amostra, a fórmula é: N ∑X i =1 i fi 670 X= N ∴X = = 33,5 20 ∑f i =1 i Média Geométrica A média geométrica de n valores é definida, genericamente, como a raiz n-ésima do produto de todos eles. A média geométrica pode ser simples ou ponderada, conforme se utilize ou não em seu cálculo uma tabela de freqüências. É aplicada a relações, taxas, índices etc. a) Média Geométrica Simples: Dados n valores x1, x2, x3,..., xn, a média geométrica desses valores será: n X g = n x1 * x2 * x3 * ... * xn ou Xg = n ∏x i =1 i Exemplo: Calcular a média geométrica dos seguintes números: X = { 10, 60, 360 } Y = { 2, 2, 2, 2 } No primeiro caso temos: x1 = 10, x2 = 60 e x3 = 360 n=3 n Xg = n ∏x ∴X i =1 i g = 3 x1 * x2 * x3 = 3 10 * 60 * 360 = 3 216.000 = 60 No segundo caso temos: y1 = 2, y2 = 2 e y3 = 2 e y4 = 2 n=4 n yg = n ∏y i =1 i ∴ y g = 4 y1 * y2 * y3 * y4 = 4 2 * 2 * 2 * 2 = 4 2 4 = 2
  • 24. b) Média Geométrica Ponderada A média geométrica ponderada de um conjunto de números dispostos em uma tabela de freqüências é calculada por intermédio da seguinte expressão: k ∑ fi Xg = j =i x f1 1 * x f 2 2 * x f3 3 * ... * x f k n ou k ∑ fi k Xg = j =i ∏x j =1 fi j Exemplo: Calcular a média geométrica dos valores constantes da seguinte tabela: xj fj 1 2 3 4 9 2 27 1 k ∑ fi = 9 j =i k ∑ fi k Xg = j =i ∏x j =1 fi j = 9 12 * 3 4 * 9 2 * 27 1 = 9 1 * 81 * 81 * 27 = 9 177147 = 3,829554 Para comprovar este resultado, basta fazer: (X ) g n = (3,829554) = 177.147 9
  • 25. Mediana e Separatrizes Mediana: É um tipo de separatriz que divide a curva em duas partes iguais de 50% cada (é o ponto central dos dados), e possui uma divisória. Para acharmos a mediana, nosso primeiro passo é ordenar a série numérica: Dados Brutos: {7, 6, 4, 3, 10} Rol: {3, 4, 6, 7, 10} Ordenada a série numérica, o próximo passo será calcular a posição da mediana. O critério para encontrar a mediana (ou qualquer separatriz) se dá da seguinte forma: • Se a posição calculada resultar em um número inteiro, separatriz desejada será uma média aritmética entre do número cuja posição foi calculada, com o número da posição imediatamente superior; • Se a posição calculada resultar em um número não inteiro, a separatriz desejada será o número da posição imediatamente superior à posição calculada. Caso de posições, calculadas onde o resultado é um número inteiro: Dados Brutos: {7, 6, 4, 3} Rol: {3, 4, 6, 7} 4 PMd = = 2 2 Como o resultado é um número inteiro, a mediana é a média entre o número da posição calculada com o número da posição imediatamente superior. Logo: 4 + 6 10 Md = = =5 2 2 Caso de posições, calculadas onde o resultado não é um número inteiro: Rol: {3, 4, 6, 7, 10} Há cinco números neste conjunto, logo a posição será: 5 PMd = = 2,5 PMd : Posição da mediana 2 Como a posição calculada é um numero não inteiro (2,5), a serapatriz desejada será o número da posição inteira imediatamente superior. Logo, a posição será 3 (três), e o terceiro número da série ordenada é 6. Então: Md = 6
  • 26. Tercil: É um tipo de separatriz que divide a curva normal em três partes iguais de 33% cada - e possui duas divisórias, que são T1 e T2, significando respectivamente: 1º tercil ou tercil inferior e 2º tercil ou tercil superior. Quartil: É um tipo de separatriz que divide a curva normal em quatro áreas, por partes iguais de 25% cada – e possui três divisórias, que são Q1, Q2 e Q3, significando respectivamente, 1º quartil ou quartil inferior, 2º quartil ou quartil médio e 3º quartil ou quartil superior. Decil: É um tipo de separatriz que divide a curva normal em dez áreas iguais de 10% cada – e possui nove divisórias, as quais vão de D1 a D9, ou seja, 1º decil ao 9º decil. Centil ou Precentil: É um tipo de separatriz que divide a curva normal em cem áreas iguais de 1% cada – e possui noventa e nove divisórias, as quais vão de C1 (1º centil) a C99 (99º centil). Simbologia: Md: Mediana Tj : Tercil na posição j Qj : Quartil na posição j Dj : Decil na posição j Cj : Centil na posição j P: Posição li : Limite inferior da classe cuja Fiab seja imediatamente superior a P. Fiab : Freqüência acumulada Faa : Freqüência acumulada anterior (trabalha-se na coluna de Fiab) h: Intervalo de classe fi : Freqüência simples Exemplos de separatrizes numa distribuição de freqüência por classes de valores: Considere a tabela abaixo, referente a idades dos alunos do Colégio X num dado período:
  • 27. Classes fi Fiab 10 --| 15 4 4 15 --| 20 109 113 20 --| 25 216 329 25 --| 30 209 538 30 --| 35 135 673 35 --| 40 78 751 40 --| 45 31 782 45 --| 50 16 798 50 --| 55 12 810 55 --| 60 3 813 Total 813 Mediana: PMd = ∑ f i = 813 = 406,5 2 2 ( P − Faa ) M d = li + h fi ( 406,5 − 329) (77,5) 387,5 M d = 25 + 5 = 25 + 5 = 25 + = 25 + 1,85 = 26,85 anos 209 209 209 Interpretação: 50% dos alunos possuem idades iguais ou inferiores a 26,85 anos. Ou 50% dos alunos possuem idades iguais ou superiores a 26,85 anos. 1º Tercil: PT1 = ∑f i = 813 = 271 3 3
  • 28. ( P − Faa ) T2 = li + h fi ( 271 − 113) (158) 790 T1 = 20 + 5 = 20 + 5 = 20 + = 20 + 3,66 = 23,66 anos 216 216 216 Interpretação: 33% dos alunos possuem idades iguais ou inferiores a 23,66 anos. Ou 67% dos alunos possuem idades iguais ou superiores a 23,66 anos. 2º Tercil: PT2 = 2 * ∑ fi 813 = 2* = 2 * 271 = 542 3 3 ( P − Faa ) T2 = li + h fi (542 − 538) T2 = 30 + 5 = 30,15 anos 135 Interpretação: 67% dos alunos possuem idades iguais ou inferiores a 30,15 anos. Ou 33% dos alunos possuem idades iguais ou superiores a 30,15 anos. 1º Quartil: PQ1 = 1 * ∑f i = 813 = 203,25 4 4 ( P − Faa ) Q1 = l i + h fi (203,25 − 113) Q1 = 20 + 5 = 22,09 anos 216 Interpretação: 25% dos alunos possuem idades iguais ou inferiores a 22,09 anos. Ou 75% dos alunos possuem idades iguais ou superiores a 22,09 anos. 3º Quartil:
  • 29. PQ2 = 3 * ∑f i 813 = 3* = 609,75 4 4 ( P − Faa ) Q3 = li + h fi (609,75 − 538) Q3 = 30 + 5 = 32,66 anos 135 Interpretação: 75% dos alunos possuem idades iguais ou inferiores a 32,66 anos. Ou 25% dos alunos possuem idades iguais ou superiores a 32,66 anos. Observações: • O resultado de ( P – Faa ) deverá ser sempre positivo; • A separatriz que estivermos trabalhando deverá ter o seu resultado dentro da classe respectiva; • Md = Q2 = D5 = C50 Moda A moda é o ponto de maior concentração, isto é, o valor que ocorre com mais freqüência. Exemplo: Dados os conjuntos: A = {4, 5, 6, 7, 8} Amodal B = {4, 5, 6, 6, 7, 8} Modal Mo = 6 C = {4, 5, 5, 6, 6, 7,8} Bimodal Mo = 5 e 6 D = {4, 5, 5, 6, 6, 7, 7, 8} Trimodal Mo = 5, 6 e 7 D = {4, 5, 5, 6, 6, 6, 7, 7, 8} Modal Mo = 6 Em uma distribuição de freqüência por classes de valores, de uma forma bastante simples, podemos encontrar a moda pela seguinte fórmula: h M o = li + 2 Sendo que a classe modal é aquela que apresentar maior freqüência.
  • 30. Exemplo: Na tabela anterior, utilizada para o exemplo de separatrizes, determine a moda: Resolução: Primeiro, procura-se a classe de maior freqüência, que é a classe 20 --| 25, a qual apresenta freqüência 216. Depois, aplica-se a fórmula. 5 M o = 20 + = 20 + 2,5 = 22,5 2 RESUMÃO A média aritmética simples A média aritmética simples de um conjunto de valores é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. É denotada por x (leia-se “x barra”) x= ∑ x , onde x são os valores observados. n x= ∑ xi . f i , se os dados estiverem organizados em distribuição de freqüência. ∑ fi Onde xi e fi são os valores do ponto médio e da freqüência absoluta da classe i- ésima respectivamente. Exemplos: 1º) Calcule a média aritmética dos valores abaixo: a. X = {0, 6, 8, 7, 4, 6} b. Y = {25, 16, 29, 19, 17} c. Z = {105, 123, 98, 140} 2º) Encontre a média para o salário destes funcionários. Salários semanais para 100 operários não especializados Salários fi xi xi.fi semanais 140 |-- 160 7 160 |-- 180 20 180 |-- 200 33 200 |-- 220 25 220 |-- 240 11
  • 31. 240 |-- 260 4 ∑ 100 Exercícios: 1) Encontre a média dos seguintes conjuntos de observações. a) X = {2, 3, 7, 8, 9}. R: 5,8 b) Y = {10, 15, 22, 18, 25, 16}. R: 16,67 c) Z = {1, 3, 6, 8}. R: 4,5 d) T = {1, 3, 6, 100}. R: 27,5 2) Encontre a média das notas na disciplina de Programação I. Notas obtidas na disciplina de Programação I Notas fi 5 |-- 6 18 6 |-- 7 15 7 |-- 8 12 8 |-- 9 03 9 |--10 02 FONTE: Dados hipotéticos. Resp 6,62. Mediana A mediana é um valor central de um rol, ou seja, a mediana de um conjunto de valores ordenados (crescente ou decrescente) é a medida que divide este conjunto em duas partes iguais. Exemplo: Calcule a mediana dos conjuntos abaixo: a- X={3, 7, 4, 12, 15, 10, 18, 14} b- Y={29, 33, 42, 38, 31, 34, 45, 51, 95} c- Z={29, 33, 42, 38, 31, 34, 45, 120, 95} Moda Seja X um conjunto de dados estatísticos. Define-se Moda de X, denotada por Mo como sendo o elemento mais freqüente no conjunto. Um conjunto de dados pode ter: • Nenhuma moda (amodal); • Uma moda (unimodal); • Duas ou mais modas (multimodal).
  • 32. Exercícios: Calcule a moda para os conjuntos abaixo: a) X= {2, 3, 4, 3, 7, 8, 9, 14}. b) Y= {2, 4, 6, 2, 8, 4, 10}. c) Z= {32, 56, 76, 4, 8, 97}. OBSERVAÇÕES: Não há regra para se dizer qual a melhor medida de tendência central. Em cada situação específica o problema deve ser analisado pelo estatístico, que concluirá pela medida mais adequada a situação. Assim é que: a) A MA é a medida mais adequada quando não há valores erráticos ou aberrantes. b) A mediana deve ser usada sempre que possível como medida representativa de distribuições com valores x 4,4 9,3 10,3 6,8 dispersos, como distribuição de rendas, Md 4 8,5 10 6,5 folhas de pagamentos, etc. Mo 6 5 Exercícios: 1) Dados os conjuntos abaixo, calcule a média aritmética, mediana e moda. A = {3, 5, 2, 1, 4, 7, 9}. B = {6, 12, 15, 7, 6, 10}. C = {10, 5, 11, 8, 15, 4, 16, 5, 20, 6, 13}. D = {4, 4, 10, 5, 8, 5, 10, 8}. 2) Calcule a média aritmética das distribuições de freqüências dos exercícios 1 e 2 das páginas 11. Resp. 1) R$ 151,79; 2) 173,53 cm e 68,15 kg.
  • 33. Medidas de Dispersão Caracterizar um conjunto de valores apenas através de uma média é descrevê-lo inadequadamente, uma vez que os dados diferem entre si, em maior ou menor grau. Logo, há necessidade de descrever tal conjunto por outra medida, a medida de dispersão. Amplitude Embora a amplitude seja a medida de variabilidade mais fácil de calcular, raramente é usada como única medida, pois não é tão boa quanto outras medidas de variação que levam em conta todos os valores. O cálculo da amplitude se dá com a diferença entre o maior e o menor valor de um conjunto de valores. Sua fórmula é: A = maior valor – menor valor Desvio Quartílico O desvio quartílico é uma medida de dispersão baseada nos quartis e calculado como a média aritmética das diferenças entre a mediana e os dois quartis, sendo, todavia, determinado mais facilmente como segue: Q3 − Q1 DQ = 2 Desvio Médio O desvio médio ou média dos desvios é igual à média aritmética dos valores absolutos dos desvios tomadas em relação a uma das seguintes medidas de tendência central: média ou mediana. n ∑x i −x DM = i =1 com a média (para dados não tabulados) n n ∑x i − Md DM = i =1 com a mediana (para dados não tabulados) n n ∑x i − x fi DM = i =1 n com a média (para dados tabulados) ∑f i =1 i
  • 34. n ∑x i − M d fi DM = i =1 n com a mediana (para dados tabulados) ∑f i =1 i Desvio Padrão Para dados não tabulados: Seja o seguinte conjunto de números: X= { x1, x2, x3, ..., xn}. O desvio padrão ou a média quadrática dos desvios ou afastamento em relação à média aritmética desse conjunto será definida por: N N ∑d ∑ (x − µ ) 2 2 i i σ = i =1 = i =1 N N onde: di = ( xi − µ ) Desta forma, podemos escrever:   N   2   ∑ xi   1  N 2  i =1   σ= ∑ xi − N  N  i =1       Quando o desvio padrão representar uma descrição da amostra e não da população, caso mais freqüênte em estatística, o denominador da expressão será igual a n – 1, em vez de N. Logo:   N   2   ∑ xi   1  N 2  i =1   S= ∑ xi − n  n − 1  i =1       Desvio padrão para dados tabulados: Quando os valores vierem dispostos em uma tabela de freqüências, o cálculo do desvio padrão se fará através de uma das seguintes fórmulas:
  • 35. z z ∑ di2 fi ∑ (x − µ ) 2 i fi σ = i =1 z = i =1 z ∑f i =1 i ∑f i =1 i Logo:   z   2   ∑ xi f i   1  z 2 x f −  i =1z   ∑ i i σ = z  ∑ fi  i =1 ∑ fi  i =1   i =1   e   z   2  z  ∑ xi f i   1  x 2 f −  i =1   S=  z   ∑i i z   ∑ f i  − 1  i =1 ∑ fi   i =1    i =1   Variância A variância é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância. Dessa forma, pode-se dizer que a fórmula da variância é igual à expressão do desvio padrão sem o sinal do radical. Temos, então:   N   2   ∑ xi   1  N 2  i =1   σ = 2 ∑ xi − N  N  i =1      
  • 36.  N   2   ∑ xi   1  N 2  i =1   S = 2 ∑ xi − n  n − 1  i =1         z   2   ∑ xi f i   1  z 2 x f −  i =1z   ∑ i i σ = z 2  ∑ fi  i =1 ∑ fi  i =1   i =1     z   2  z ∑ xi f i   1  x 2 f −  i =1   ∑ i i S2 = z   z   ∑ f i  − 1  i =1 ∑ fi   i =1    i =1   Exemplo 1: Encontre o desvio padrão para os dados das séries a), e b) acima. Exemplo 2: Salários semanais para 100 operários não especializados Salários fi xi (xi- x )2 (xi- x )2fi semanais 140 |-- 160 7 160 |-- 180 20 180 |-- 200 33 200 |-- 220 25 220 |-- 240 11 240 |-- 260 4 ∑ 100 Encontre o desvio padrão para o salário destes funcionários. Exercício: Calcule o desvio padrão das distribuições de freqüências dos exercícios 1 e 2 das páginas 11 e 12.
  • 37. Coeficiente de variação: Trata-se de uma medida de dispersão, útil para a compreensão em termos relativos do grau de concentração em torno da média de séries distintas. É dado por: σ Cv = .100 x Exemplo 4: Para duas emissões de ações ordinárias da indústria eletrônica, o preço médio diário, no fechamento dos negócios, durante um período de um mês, para as ações A, foi de R$ 150,00 com um desvio padrão de R$ 5,00. Para as ações B, o preço médio foi de R$ 50,00 com um desvio padrão de R$ 3,00. Em relação ao nível do preço, qual dos tipos de ações é mais variável? Exercícios. 1) Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma certa semana, arredondados para o valor mais próximo e apresentados em ordem crescente: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Calcular (a) a média, (b) a mediana, (c) a moda, (d) o desvio padrão, (e) o coeficiente de variação, para este grupo de salários. R: a) 170,5; d) 33,12. 2) O número de carros vendidos por cada um dos vendedores de um negócio de automóveis durante um mês particular, em ordem crescente: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15. Determinar (a) a média, (b) a mediana, (c) a moda, (d) o desvio padrão R: a) 9,6; d) 3,95. 3) Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo necessário para realizar a auditoria de 50 balanços contábeis. Calcular (a) a média, (b) o desvio padrão, para o tempo de auditoria necessário para esta amostra de registro. R: a) 43,2; b)12,28. Tempo necessário para a auditoria de balanços contábeis. Tempo de auditoria. Nº de balanços. (min.) (fi) 10 |-- 20 3 20 |-- 30 5 30 |-- 40 10 40 |-- 50 12 50 |-- 60 20 Total 50
  • 38. 4) Os salários semanais de 50 funcionários de um hospital, em reais, foram os seguintes: 100 122 130 140 152 160 164 176 180 188 192 200 216 104 126 134 146 156 160 170 176 184 190 194 200 218 116 128 138 150 156 162 170 178 186 190 196 200 120 128 140 150 156 162 176 180 186 192 196 210 a) Construa uma distribuição de freqüências, com h = 20 e limite inferior para a primeira classe igual a 100. b) Quantos funcionários tem um salário semanal situado entre R$ 120,00 (inclusive) e R$ 160,00 (exclusive)? 17 funcionários c) Que porcentagem de funcionários tem um salário semanal situado entre R$ 180,00 (inclusive) e R$ 200,00 (exclusive)?26% d) Qual o salário médio semanal destes funcionários utilizando o item a)?166,4 e) Determine o desvio padrão e o coeficiente de variação da distribuição. 28,76; 17,28% 5) A distribuição das alturas de um grupo de pessoas apresentou uma altura média de 182 cm e um desvio padrão de 15 cm, enquanto que a distribuição dos pesos, apresentou um peso médio de 78 kg, com um desvio padrão de 8 kg. Qual das duas distribuições apresentou maior dispersão? Por quê?
  • 39. Principais Índices Brasileiros: IPC – Índice de Preços ao Consumidor IPC/Fipe (São Paulo): É calculado com base em 4 conglomerados de, aproximadamente, 300 endereços, sistematicamente pesquisados. A ponderação é alterada sempre que ocorram mudanças significativas. São pesquisados mais de 250 produtos, gerando cerca de 50.000 preços a pesquisar. É calculado pela média geométrica dos relativos (Divisia) e divulgado semanalmente. ICV/Dieese (São Paulo): São utilizados aproximadamente 350 produtos, pesquisados em famílias paulistanas com renda mensal entre 1 e 30 s.m. (cesta de bens pesquisada em 1982/83). INPC- Índice Nacional de Preços ao Consumidor: É calculado com base nos preços de 11 regiões metropolitanas (São Paulo, Rio de Janeiro, Porto Alegre, Belo Horizonte, Salvador, Recife, Belém, Fortaleza, Curitiba, Goiânia e Brasília), num total de 116 municípios, em famílias com renda entre 1 e 8 s.m. São utilizados, aproximadamente, 350 produtos e 140.000 preços a pesquisar. São obtidos índices regionais. O índice nacional é obtido por ponderação dos regionais. O índice para produtos sazonais é calculado por Paasche. IPCA – Índice de Preços ao Consumidor Ampliado: Variante do INPC, utiliza renda entre 1 e 40 s.m. IPA – Índice de Preços por Atacado: Utiliza, aproximadamente, 430 produtos, totalizando cerca de 10.000 preços atualizados mensalmente. O cálculo do índice é feito por Laspeyres com base móvel. INCC – Índice Nacional da Construção Civil: É obtido com base nos preços e quantidades padrões consumidas na construção de casas térreas (em média 82 m²) e edifícios com quatro, oito e doze pavimentos. São considerados 427 itens de materiais de construção, serviços e mão-de-obra. IGP – Índice Geral de Preços: Calculado pela FGV - Fundação Getúlio Vargas, utiliza bens e serviços, assim como os respectivos pesos, atualizados sistematicamente, de acordo com o momento econômico. Utiliza a fórmula de Laspeyres de base móvel. É a média ponderada do IPA (0,6), do IPC (0,3) e do INCC (0,1).