SlideShare uma empresa Scribd logo
1 de 24
Baixar para ler offline
Aula 3


         Medidas Resumo

         Profa. Dra. Juliana Garcia Cespedes
         Dep. de Matemática e Computação
                              UNIFEI - Itajubá
Medidas de posição
Vimos como resumir os dados por meio de tabelas de
  frequências e gráficos. Desta forma obtemos
  informações sobre o comportamento de uma variável.

Mas, muitas vezes, queremos resumir ainda mais estes
  dados, apresentando um ou alguns valores que sejam
  representativos da série toda.

Quando usamos um só valor, reduzimos drasticamente os
  dados.

Geralmente, emprega-se as medidas de posição
  (localização) central: média, mediana ou moda
Média
• Conceito familiar: É a soma das observações
  dividia pelo número total delas.

• Conceito formal: Se x1, ..., xn são os n valores
  da variável X, a média aritmética de X pode ser
  escrita:
                       n

                      x       i
                 X   i 1
                           n
Média
• Se os dados estiverem resumidos em uma tabela de
  frequências, então a média de X pode ser escrita:

                           k

                         fx           i i
                    X    i 1
                                   n

• Ou, usando a frequência relativa:
                               k
                    X   fri xi
                           i 1
N. Filhos Freq. Abs. Freq. rela. Freq. Acum.   %
        0         4         0.2          0.2       20%
        1         5        0.25         0.45       25%
        2         7        0.35          0.8       35%
        3         3        0.15         0.95       15%
        4         0          0          0.95       0%
        5         1        0.05           1        5%
      Total      20          1                    100%


        4 * 0  5 *1  7 * 2  ...  1* 5
     X                                    1,65
                      20

X  0,2 * 0  0,25 *1  0,35 * 2  ...  0,05 * 5  1,65
Classe de        Freq        Freq relativa   Freq acum   Porcentagem
 salários
 [4,00; 8,00)            10   10/36 =0,278       0,278      27,78%

 [8,00; 12,00)           12   12/36 =0,333       0,611      33,33%

 [12,00; 16,00)          8     8/36 =0,222       0,833      22,22%

 [16,00; 20,00)          5     5/36 =0,139       0,972      13,89%

 [20,00; 24,00)          1     1/36 =0,029       1,000       2,78%

 Total                   36         1                        100%



    10 * 6,00  12 *10,00  8 *14,00  ...  1* 22,00
 X                                                    11,22
                          36


X  0,27 * 6,0  0,33 *10,0  0,22 *14,0  ...  0,03 * 22,0  11,22
Mediana
• A Mediana é a realização que ocupa a posição central da
  série de observações, quando estão ordenadas em ordem
  crescente.

• Se o número de observações for ímpar o mediana é a
  posição central da série:
                         3, 4, 7, 8, 8

• Se o número de observações for par, usa-se como
  mediana a média aritmética das duas observações
  centrais:
                  3, 4, 7, 8   (4+7)/2 = 5,5
Mediana
• Conceito formal:
Considere as estatísticas de ordem x(1)  x(2) ...  x(n)

• A mediana da variável X pode ser definida como:

                  x n 1 
                                  , se n ímpar;
                          2 
      md ( X )   x n   x n 
                               1 
                   2   2  , se n par.
                     

                 
                           2
0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5


             x 20   x 20   
               
               2 
                           1 
                           2 
                                       x10  x11     22
md ( X )                                                  2
                      2                     2             2
     N. Filhos Freq. Abs. Freq. rela. Freq. Acum.       %
          0         4         0.2          0.2           20%
          1         5        0.25         0.45           25%
          2         7        0.35          0.8           35%
          3         3        0.15         0.95           15%
          4         0          0          0.95           0%
          5         1        0.05           1            5%
        Total      20          1                        100%
Classe de        Freq            Freq relativa   Freq acum   Porcentagem
salários
[4,00; 8,00)            10       10/36 =0,278       0,278      27,78%

[8,00; 12,00)           12       12/36 =0,333       0,611      33,33%

[12,00; 16,00)          8         8/36 =0,222       0,833      22,22%

[16,00; 20,00)          5         5/36 =0,139       0,972      13,89%

[20,00; 24,00)          1         1/36 =0,029       1,000       2,78%

Total                   36             1                        100%




                 Pm18  Pm19             10,00  10,00
md ( X )                                                  10,00
                             2                     2
Moda
• A moda é definida como a realização mais
  frequente do conjunto de valores observados.

• Pode haver mais de uma moda, ou seja, a
  distribuições dos valores pode ser bimodal,
  trimodal, ..., multimodal.
0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5



                 mo( X )  2

N. Filhos Freq. Abs. Freq. rela. Freq. Acum.   %
     0         4         0.2          0.2       20%
     1         5        0.25         0.45       25%
     2         7        0.35          0.8       35%
     3         3        0.15         0.95       15%
     4         0          0          0.95       0%
     5         1        0.05           1        5%
   Total      20          1                    100%
Classe de        Freq           Freq relativa   Freq acum   Porcentagem
salários
[4,00; 8,00)            10      10/36 =0,278       0,278      27,78%

[8,00; 12,00)           12      12/36 =0,333       0,611      33,33%

[12,00; 16,00)          8        8/36 =0,222       0,833      22,22%

[16,00; 20,00)          5        5/36 =0,139       0,972      13,89%

[20,00; 24,00)          1        1/36 =0,029       1,000       2,78%

Total                   36            1                        100%




                             mo( X )  10,00
Medidas resumo
• Para calcular a moda precisamos apenas da
  tabela de frequências.
 (Variáveis qualitativas e quantitativas)

• Para calcular a mediana, precisamos ordenar as
  realizações da variável.
 (Variáveis qualitativas ordinal e quantitativas)

• Para a média precisamos que as variáveis sejam
  mensuráveis.
 (Variáveis quantitativas)
Medidas de dispersão
• O resumo de um conjunto de dados por uma única
  medida de posição central esconde toda a
  informação sobre a variabilidade do conjunto de
  observações.

• Considere a nota de cinco grupos de alunos:
  Grupo A (Variável X): 3,4,5,6,7
  Grupo B (Variável Y): 1,3,5,7,9      X Y  Z 
  Grupo C (Variável Z): 5,5,5,5,5
                                       W V  5
  Grupo D (Variável W): 3,5,5,7
  Grupo E (Variável V): 3,5,5,6,6
Medidas de dispersão
• A média de cada grupo é igual, e com isso não
  conseguimos informação sobre sua variabilidade.

• Para resumir a variabilidade de um conjunto de
  dados utiliza-se a dispersão dos dados em torno da
  média, e as medidas mais usadas são a variância
  e o desvio padrão.

• Os desvios da média para o grupo A são -2, -1, 0,
  1, 2. (Para qualquer conjunto de dados a soma
  destes desvios é zero!!!)
Medidas de dispersão
• Opções:
• Considerar o total dos módulos dos desvios:
                 n

                | x  X |
                i 1
                        i


• Considerar o total dos quadrados dos desvios


                 x  X 
                  n
                             2
                        i
                 i 1
Medidas de dispersão
• Mas como comparar essas medidas quando os
  conjuntos de dados tem tamanhos diferentes?

• É melhor exprimir as medidas como médias:


                                         x  X 
             n                           n

            | x  X |
                                                   2
                   i                           i
dm( X )    i 1
                           var( X )    i 1

                   n                           n

Desvio médio                Variância
Medidas de dispersão
As medidas de variabilidade indicam o quão
  homogêneo é um conjunto de dados.
Para os grupos A e E tem-se:
           2 1 0 1 2
dm( X )                  1,2
                 5
           4 1 0 1 4
var( X )                 2,0
                 5
                                           2  0  0 11
                                 dm(V )                   0,8
                                                  5
                                           4  0  0 11
                                 var(V )                  1,2
                                                  5
Medidas de dispersão
A variância é uma medida de dispersão igual ao
  quadrado da dimensão dos dados, pode causar
  problemas de interpretação. Costuma-se usar,
  então o desvio padrão, que é definido como a raiz
  quadrada positiva da variância.



                               x  X 
                                n
                                          2
                                      i
     dp( X )  var( X )       i 1
                                      n
Medidas de dispersão
A medida de dispersão, desvio padrão, indica em
  média qual será o “erro” (desvio) cometido ao
  tentar substituir cada observação pela medida
  resumo do conjunto de dados (Média).

Se os dados estiverem agrupados em tabelas de
  frequências, as medidas de dispersão são dadas
  por:
                  f x  X 
                k
                                2


                                      fri xi  X 
                        i   i          k
                                                    2
    var( X )    i 1
                            n         i 1
Medidas de dispersão
Uma maneira equivalente de calcular a variância,
 computacionalmente mais eficiente, é:
                          n

                         x          2
                                     i
            var( X )    i 1
                                         X        2

                                n
                          k

                                   f i xi2
                        i 1
                                                  X   2

                                n
                          k
                      fri xi  X 2
                                              2

                         i 1
Exercício
Quer se estudar o número de erros de impressão de um
  livro. Para isso escolheu-se uma amostra de 50 páginas,
  encontrando-se o número de erros por página.
• Qual o número médio de erros? E o número mediano?
• Qual é o desvio padrão?
• Se o livro tem 500 páginas, qual o número total de erros
  esperado no livro?
                     Erros   Freq
                       0      25
                       1      20
                       2       3
                       3       1
                       4       1
Solução
•   Média = 0,66
•   Mediana = 0,5
•   Desvio padrão = 0,8393
•   Valor esperado = 330

Mais conteúdo relacionado

Mais procurados

Organização e Tratamento de Dados
Organização e Tratamento de Dados Organização e Tratamento de Dados
Organização e Tratamento de Dados estudamatematica
 
Aula prática estatistica 2017
Aula prática estatistica 2017Aula prática estatistica 2017
Aula prática estatistica 2017Sandro Cambinda
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricosRodrigo Rodrigues
 
Estatística
EstatísticaEstatística
Estatísticaaldaalves
 
Probabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasLucas Vinícius
 
Produto cartesiano - Relação - Função
Produto cartesiano - Relação - FunçãoProduto cartesiano - Relação - Função
Produto cartesiano - Relação - Funçãosralkmim
 
Determinar frequências absoluta, relativa e relativa percentual
Determinar frequências absoluta, relativa e relativa percentualDeterminar frequências absoluta, relativa e relativa percentual
Determinar frequências absoluta, relativa e relativa percentualdean dundas
 
Função de duas variáveis, domínios e imagem
Função de duas variáveis, domínios e imagemFunção de duas variáveis, domínios e imagem
Função de duas variáveis, domínios e imagemIsadora Toledo
 
Econometria modelos de_regressao_linear
Econometria modelos de_regressao_linearEconometria modelos de_regressao_linear
Econometria modelos de_regressao_linearJoevan Santos
 

Mais procurados (20)

Prática de Regressão no SPSS
Prática de Regressão no SPSSPrática de Regressão no SPSS
Prática de Regressão no SPSS
 
Aula 12 intervalo de confiança
Aula 12   intervalo de confiançaAula 12   intervalo de confiança
Aula 12 intervalo de confiança
 
Estatistica descritiva
Estatistica descritiva Estatistica descritiva
Estatistica descritiva
 
Organização e Tratamento de Dados
Organização e Tratamento de Dados Organização e Tratamento de Dados
Organização e Tratamento de Dados
 
Distribuição binomial, poisson e hipergeométrica - Estatística I
Distribuição binomial, poisson e hipergeométrica - Estatística IDistribuição binomial, poisson e hipergeométrica - Estatística I
Distribuição binomial, poisson e hipergeométrica - Estatística I
 
Aula prática estatistica 2017
Aula prática estatistica 2017Aula prática estatistica 2017
Aula prática estatistica 2017
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricos
 
Aula 13 teste de hipóteses
Aula 13   teste de hipótesesAula 13   teste de hipóteses
Aula 13 teste de hipóteses
 
Estatística
EstatísticaEstatística
Estatística
 
Probabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis Aleatórias
 
# Conjuntos 2007
# Conjuntos 2007# Conjuntos 2007
# Conjuntos 2007
 
Conceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística II
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Produto cartesiano - Relação - Função
Produto cartesiano - Relação - FunçãoProduto cartesiano - Relação - Função
Produto cartesiano - Relação - Função
 
Introdução à Estatística
Introdução à EstatísticaIntrodução à Estatística
Introdução à Estatística
 
Determinar frequências absoluta, relativa e relativa percentual
Determinar frequências absoluta, relativa e relativa percentualDeterminar frequências absoluta, relativa e relativa percentual
Determinar frequências absoluta, relativa e relativa percentual
 
Estatistica[1]
Estatistica[1]Estatistica[1]
Estatistica[1]
 
Função de duas variáveis, domínios e imagem
Função de duas variáveis, domínios e imagemFunção de duas variáveis, domínios e imagem
Função de duas variáveis, domínios e imagem
 
Aula 07 Medidas de Tendencia Central de Dados Não Agrupados
Aula 07   Medidas de Tendencia Central de Dados Não AgrupadosAula 07   Medidas de Tendencia Central de Dados Não Agrupados
Aula 07 Medidas de Tendencia Central de Dados Não Agrupados
 
Econometria modelos de_regressao_linear
Econometria modelos de_regressao_linearEconometria modelos de_regressao_linear
Econometria modelos de_regressao_linear
 

Destaque

Desvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrõesDesvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrõesGabriel Passeri
 
Exemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequenciaExemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequenciaRenato Ribeiro Soares
 
Aula 6 probabilidade condicional
Aula 6   probabilidade condicionalAula 6   probabilidade condicional
Aula 6 probabilidade condicionalAriel Rennó Chaves
 
Exercicios resolv estatistica
Exercicios resolv estatisticaExercicios resolv estatistica
Exercicios resolv estatisticaJosi2010
 
Probabilidade e estatística
Probabilidade e estatísticaProbabilidade e estatística
Probabilidade e estatísticaNeilton Pedro
 
Aula 1 data de provas e apresentações
Aula 1   data de provas e apresentaçõesAula 1   data de provas e apresentações
Aula 1 data de provas e apresentaçõesAriel Rennó Chaves
 
Aula 9 variáveis aleatória contínua - parte 2
Aula 9   variáveis aleatória contínua - parte 2Aula 9   variáveis aleatória contínua - parte 2
Aula 9 variáveis aleatória contínua - parte 2Ariel Rennó Chaves
 
Estatística Básica - Variância
Estatística Básica - VariânciaEstatística Básica - Variância
Estatística Básica - VariânciaAndré Faria Gomes
 
Medidas de dispersão
Medidas de dispersãoMedidas de dispersão
Medidas de dispersãopaulocsm
 
Aula 8 variáveis aleatória contínua - parte 1
Aula 8   variáveis aleatória contínua - parte 1Aula 8   variáveis aleatória contínua - parte 1
Aula 8 variáveis aleatória contínua - parte 1Ariel Rennó Chaves
 

Destaque (20)

Aula 5 probabilidade
Aula 5   probabilidadeAula 5   probabilidade
Aula 5 probabilidade
 
Estatistica descritiva i
Estatistica descritiva iEstatistica descritiva i
Estatistica descritiva i
 
Aula 14 new
Aula 14 newAula 14 new
Aula 14 new
 
Desvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrõesDesvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrões
 
Aula 4 medidas resumo - parte 2
Aula 4   medidas resumo - parte 2Aula 4   medidas resumo - parte 2
Aula 4 medidas resumo - parte 2
 
Exerccios aula13
Exerccios aula13Exerccios aula13
Exerccios aula13
 
Aula 2 resumo de dados
Aula 2   resumo de dadosAula 2   resumo de dados
Aula 2 resumo de dados
 
Exemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequenciaExemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequencia
 
Aula 6 probabilidade condicional
Aula 6   probabilidade condicionalAula 6   probabilidade condicional
Aula 6 probabilidade condicional
 
Exercicios resolv estatistica
Exercicios resolv estatisticaExercicios resolv estatistica
Exercicios resolv estatistica
 
Probabilidade e estatística
Probabilidade e estatísticaProbabilidade e estatística
Probabilidade e estatística
 
Aula 1 data de provas e apresentações
Aula 1   data de provas e apresentaçõesAula 1   data de provas e apresentações
Aula 1 data de provas e apresentações
 
Valoración y tratamiento de osteoporosis Atención Primaria. Revisión previa a...
Valoración y tratamiento de osteoporosis Atención Primaria. Revisión previa a...Valoración y tratamiento de osteoporosis Atención Primaria. Revisión previa a...
Valoración y tratamiento de osteoporosis Atención Primaria. Revisión previa a...
 
Aula 9 variáveis aleatória contínua - parte 2
Aula 9   variáveis aleatória contínua - parte 2Aula 9   variáveis aleatória contínua - parte 2
Aula 9 variáveis aleatória contínua - parte 2
 
Estatística Básica - Variância
Estatística Básica - VariânciaEstatística Básica - Variância
Estatística Básica - Variância
 
Medidas de dispersão
Medidas de dispersãoMedidas de dispersão
Medidas de dispersão
 
Aula 8 variáveis aleatória contínua - parte 1
Aula 8   variáveis aleatória contínua - parte 1Aula 8   variáveis aleatória contínua - parte 1
Aula 8 variáveis aleatória contínua - parte 1
 
Aula 10 planejamento da amostra
Aula 10   planejamento da amostraAula 10   planejamento da amostra
Aula 10 planejamento da amostra
 
Medidas de dispersão
Medidas de dispersãoMedidas de dispersão
Medidas de dispersão
 
Aula 7 variáveis aleatórias
Aula 7   variáveis aleatóriasAula 7   variáveis aleatórias
Aula 7 variáveis aleatórias
 

Semelhante a Aula 3 medidas resumo - parte 1

Semelhante a Aula 3 medidas resumo - parte 1 (20)

C7 exercicios
C7 exerciciosC7 exercicios
C7 exercicios
 
Aula 12 medidas de dispersão
Aula 12   medidas de dispersãoAula 12   medidas de dispersão
Aula 12 medidas de dispersão
 
Estatística Descritiva - parte 2 (ISMT)
Estatística Descritiva - parte 2 (ISMT)Estatística Descritiva - parte 2 (ISMT)
Estatística Descritiva - parte 2 (ISMT)
 
Doc estatistica _687118434
Doc estatistica _687118434Doc estatistica _687118434
Doc estatistica _687118434
 
Porcentagem
PorcentagemPorcentagem
Porcentagem
 
Estatística10
Estatística10Estatística10
Estatística10
 
Tratamento e Organização de Dados
Tratamento e Organização de DadosTratamento e Organização de Dados
Tratamento e Organização de Dados
 
Aula 05
Aula 05Aula 05
Aula 05
 
Aula 11 BIO745 Regressão.pdf
Aula 11 BIO745 Regressão.pdfAula 11 BIO745 Regressão.pdf
Aula 11 BIO745 Regressão.pdf
 
Qualidade Estudo De Meta
Qualidade Estudo De MetaQualidade Estudo De Meta
Qualidade Estudo De Meta
 
Spss 05 Estimando
Spss 05 EstimandoSpss 05 Estimando
Spss 05 Estimando
 
1 normal u
1 normal u1 normal u
1 normal u
 
Mat porcentagem juros simples
Mat porcentagem juros simplesMat porcentagem juros simples
Mat porcentagem juros simples
 
Gabriel estatistica - aula 2
Gabriel   estatistica - aula 2Gabriel   estatistica - aula 2
Gabriel estatistica - aula 2
 
Aula de distribuição de probabilidade[1]
Aula de distribuição de probabilidade[1]Aula de distribuição de probabilidade[1]
Aula de distribuição de probabilidade[1]
 
Aula de distribuição de probabilidade[1] cópia
Aula de distribuição de probabilidade[1]   cópiaAula de distribuição de probabilidade[1]   cópia
Aula de distribuição de probabilidade[1] cópia
 
Aula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptxAula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptx
 
Distribuicaonormal
DistribuicaonormalDistribuicaonormal
Distribuicaonormal
 
Distribuicao normal2.0
Distribuicao normal2.0Distribuicao normal2.0
Distribuicao normal2.0
 
Trabalho nº9
Trabalho nº9Trabalho nº9
Trabalho nº9
 

Mais de Ariel Rennó Chaves

Mais de Ariel Rennó Chaves (8)

Módulo 1 - Piscicultura.pdf
Módulo 1 - Piscicultura.pdfMódulo 1 - Piscicultura.pdf
Módulo 1 - Piscicultura.pdf
 
Lista6
Lista6Lista6
Lista6
 
Lista 5 modelos de probabilidade
Lista 5   modelos de probabilidadeLista 5   modelos de probabilidade
Lista 5 modelos de probabilidade
 
Lista 4 variáveis aleatórias discretas
Lista 4   variáveis aleatórias discretasLista 4   variáveis aleatórias discretas
Lista 4 variáveis aleatórias discretas
 
Lista 3 probabilidade
Lista 3   probabilidadeLista 3   probabilidade
Lista 3 probabilidade
 
Lista 2 coeficiente de correlação
Lista 2   coeficiente de correlaçãoLista 2   coeficiente de correlação
Lista 2 coeficiente de correlação
 
Lista 1 tabela de frequencias e medidas resumo
Lista 1   tabela de frequencias e medidas resumoLista 1   tabela de frequencias e medidas resumo
Lista 1 tabela de frequencias e medidas resumo
 
Aula 11 estimação
Aula 11   estimaçãoAula 11   estimação
Aula 11 estimação
 

Aula 3 medidas resumo - parte 1

  • 1. Aula 3 Medidas Resumo Profa. Dra. Juliana Garcia Cespedes Dep. de Matemática e Computação UNIFEI - Itajubá
  • 2. Medidas de posição Vimos como resumir os dados por meio de tabelas de frequências e gráficos. Desta forma obtemos informações sobre o comportamento de uma variável. Mas, muitas vezes, queremos resumir ainda mais estes dados, apresentando um ou alguns valores que sejam representativos da série toda. Quando usamos um só valor, reduzimos drasticamente os dados. Geralmente, emprega-se as medidas de posição (localização) central: média, mediana ou moda
  • 3. Média • Conceito familiar: É a soma das observações dividia pelo número total delas. • Conceito formal: Se x1, ..., xn são os n valores da variável X, a média aritmética de X pode ser escrita: n x i X i 1 n
  • 4. Média • Se os dados estiverem resumidos em uma tabela de frequências, então a média de X pode ser escrita: k fx i i X i 1 n • Ou, usando a frequência relativa: k X   fri xi i 1
  • 5. N. Filhos Freq. Abs. Freq. rela. Freq. Acum. % 0 4 0.2 0.2 20% 1 5 0.25 0.45 25% 2 7 0.35 0.8 35% 3 3 0.15 0.95 15% 4 0 0 0.95 0% 5 1 0.05 1 5% Total 20 1 100% 4 * 0  5 *1  7 * 2  ...  1* 5 X  1,65 20 X  0,2 * 0  0,25 *1  0,35 * 2  ...  0,05 * 5  1,65
  • 6. Classe de Freq Freq relativa Freq acum Porcentagem salários [4,00; 8,00) 10 10/36 =0,278 0,278 27,78% [8,00; 12,00) 12 12/36 =0,333 0,611 33,33% [12,00; 16,00) 8 8/36 =0,222 0,833 22,22% [16,00; 20,00) 5 5/36 =0,139 0,972 13,89% [20,00; 24,00) 1 1/36 =0,029 1,000 2,78% Total 36 1 100% 10 * 6,00  12 *10,00  8 *14,00  ...  1* 22,00 X  11,22 36 X  0,27 * 6,0  0,33 *10,0  0,22 *14,0  ...  0,03 * 22,0  11,22
  • 7. Mediana • A Mediana é a realização que ocupa a posição central da série de observações, quando estão ordenadas em ordem crescente. • Se o número de observações for ímpar o mediana é a posição central da série: 3, 4, 7, 8, 8 • Se o número de observações for par, usa-se como mediana a média aritmética das duas observações centrais: 3, 4, 7, 8 (4+7)/2 = 5,5
  • 8. Mediana • Conceito formal: Considere as estatísticas de ordem x(1)  x(2) ...  x(n) • A mediana da variável X pode ser definida como:  x n 1     , se n ímpar;   2  md ( X )   x n   x n   1    2   2  , se n par.     2
  • 9. 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 x 20   x 20     2   1   2  x10  x11 22 md ( X )    2 2 2 2 N. Filhos Freq. Abs. Freq. rela. Freq. Acum. % 0 4 0.2 0.2 20% 1 5 0.25 0.45 25% 2 7 0.35 0.8 35% 3 3 0.15 0.95 15% 4 0 0 0.95 0% 5 1 0.05 1 5% Total 20 1 100%
  • 10. Classe de Freq Freq relativa Freq acum Porcentagem salários [4,00; 8,00) 10 10/36 =0,278 0,278 27,78% [8,00; 12,00) 12 12/36 =0,333 0,611 33,33% [12,00; 16,00) 8 8/36 =0,222 0,833 22,22% [16,00; 20,00) 5 5/36 =0,139 0,972 13,89% [20,00; 24,00) 1 1/36 =0,029 1,000 2,78% Total 36 1 100% Pm18  Pm19 10,00  10,00 md ( X )    10,00 2 2
  • 11. Moda • A moda é definida como a realização mais frequente do conjunto de valores observados. • Pode haver mais de uma moda, ou seja, a distribuições dos valores pode ser bimodal, trimodal, ..., multimodal.
  • 12. 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 mo( X )  2 N. Filhos Freq. Abs. Freq. rela. Freq. Acum. % 0 4 0.2 0.2 20% 1 5 0.25 0.45 25% 2 7 0.35 0.8 35% 3 3 0.15 0.95 15% 4 0 0 0.95 0% 5 1 0.05 1 5% Total 20 1 100%
  • 13. Classe de Freq Freq relativa Freq acum Porcentagem salários [4,00; 8,00) 10 10/36 =0,278 0,278 27,78% [8,00; 12,00) 12 12/36 =0,333 0,611 33,33% [12,00; 16,00) 8 8/36 =0,222 0,833 22,22% [16,00; 20,00) 5 5/36 =0,139 0,972 13,89% [20,00; 24,00) 1 1/36 =0,029 1,000 2,78% Total 36 1 100% mo( X )  10,00
  • 14. Medidas resumo • Para calcular a moda precisamos apenas da tabela de frequências. (Variáveis qualitativas e quantitativas) • Para calcular a mediana, precisamos ordenar as realizações da variável. (Variáveis qualitativas ordinal e quantitativas) • Para a média precisamos que as variáveis sejam mensuráveis. (Variáveis quantitativas)
  • 15. Medidas de dispersão • O resumo de um conjunto de dados por uma única medida de posição central esconde toda a informação sobre a variabilidade do conjunto de observações. • Considere a nota de cinco grupos de alunos: Grupo A (Variável X): 3,4,5,6,7 Grupo B (Variável Y): 1,3,5,7,9 X Y  Z  Grupo C (Variável Z): 5,5,5,5,5 W V  5 Grupo D (Variável W): 3,5,5,7 Grupo E (Variável V): 3,5,5,6,6
  • 16. Medidas de dispersão • A média de cada grupo é igual, e com isso não conseguimos informação sobre sua variabilidade. • Para resumir a variabilidade de um conjunto de dados utiliza-se a dispersão dos dados em torno da média, e as medidas mais usadas são a variância e o desvio padrão. • Os desvios da média para o grupo A são -2, -1, 0, 1, 2. (Para qualquer conjunto de dados a soma destes desvios é zero!!!)
  • 17. Medidas de dispersão • Opções: • Considerar o total dos módulos dos desvios: n | x  X | i 1 i • Considerar o total dos quadrados dos desvios  x  X  n 2 i i 1
  • 18. Medidas de dispersão • Mas como comparar essas medidas quando os conjuntos de dados tem tamanhos diferentes? • É melhor exprimir as medidas como médias:  x  X  n n | x  X | 2 i i dm( X )  i 1 var( X )  i 1 n n Desvio médio Variância
  • 19. Medidas de dispersão As medidas de variabilidade indicam o quão homogêneo é um conjunto de dados. Para os grupos A e E tem-se: 2 1 0 1 2 dm( X )   1,2 5 4 1 0 1 4 var( X )   2,0 5 2  0  0 11 dm(V )   0,8 5 4  0  0 11 var(V )   1,2 5
  • 20. Medidas de dispersão A variância é uma medida de dispersão igual ao quadrado da dimensão dos dados, pode causar problemas de interpretação. Costuma-se usar, então o desvio padrão, que é definido como a raiz quadrada positiva da variância.  x  X  n 2 i dp( X )  var( X )  i 1 n
  • 21. Medidas de dispersão A medida de dispersão, desvio padrão, indica em média qual será o “erro” (desvio) cometido ao tentar substituir cada observação pela medida resumo do conjunto de dados (Média). Se os dados estiverem agrupados em tabelas de frequências, as medidas de dispersão são dadas por:  f x  X  k 2   fri xi  X  i i k 2 var( X )  i 1 n i 1
  • 22. Medidas de dispersão Uma maneira equivalente de calcular a variância, computacionalmente mais eficiente, é: n x 2 i var( X )  i 1 X 2 n k  f i xi2  i 1 X 2 n k   fri xi  X 2 2 i 1
  • 23. Exercício Quer se estudar o número de erros de impressão de um livro. Para isso escolheu-se uma amostra de 50 páginas, encontrando-se o número de erros por página. • Qual o número médio de erros? E o número mediano? • Qual é o desvio padrão? • Se o livro tem 500 páginas, qual o número total de erros esperado no livro? Erros Freq 0 25 1 20 2 3 3 1 4 1
  • 24. Solução • Média = 0,66 • Mediana = 0,5 • Desvio padrão = 0,8393 • Valor esperado = 330