SlideShare uma empresa Scribd logo
Universidade Estadual da Paraíba
                                       Disciplina: Biometria
                               Professora: Nyedja Fialho M. Barbosa

                              Assunto: Medidas de Posição e Dispersão

Medidas de variáveis utilizadas em Estatísticas:




Medidas de tendência Central ou Posição:
        Buscam evidenciar o comportamento central de uma variável. Dentre as mais utilizadas
destacam-se:
     Moda:

            o    Definição: moda é o valor mais frequente na amostra.
            o    Notação:

                        Observações:
                             Quando DOIS VALORES ocorrem com a mesma maior frequência,
                                 cada um deles é uma moda, e o conjunto de dados é dito BIMODAL;
                             Quando MAIS DE DOIS VALORES ocorre com a mesma maior
                                 frequência, cada um deles é uma moda, e o conjunto de dados é dito
                                 MULTIMODAL;
                             Quando NENHUM VALOR se repete com maior frequência,
                                 dizemos que não há moda, e o conjunto de dados é dito AMODAL.

       Mediana:

            o    Definição: Mediana é o valor da variável que particiona a amostra ao meio. Isto é, o
                 valor que deixa abaixo de si 50% das observações.
            o    Notação:       ou

                                            ~
                                            x

                 0                  50%                 100%


            o   Fórmulas:


       Média aritmética:

            o    Definição: média o valor dado pela soma de todos os valores da amostra, dividida pelo
                 número desses valores.
o   Notação:
        o   Fórmulas:

                 x  x2    xn 1                          1 n
              x 1                  x1  x 2    x n    xi
                          n          n                      n i 1
                                                                        ,
               x1  x 2    x N  1 x  x    x   1
                                                                    N

             
                          N           N
                                           1    2         N          xi
                                                               N i 1
            Onde:

                   : indica a adição de um conjunto de valores (somatório);
            x : é a variável usada para representar os valores individuais dos dados;
            n : número de valores na amostra;
            N : número de valores na população;
            x : média do conjunto de valores AMOSTRAIS;
             : média de todos os valores existentes na POPULAÇÃO;

           Propriedades da média:

                 o     A média é altamente influenciada por valores extremos. Nem sempre poderá
                       ser utilizada como medida que resuma adequadamente um conjunto de dados,
                       visto que esta não carrega em si a noção de variabilidade.

                               Exemplo: Tabela 1: Número de salários de cinco funcionários das
                                empresas A, B, C e D, escolhidos ao acaso.

                                                                  Funcionários
                                Empresas
                                                1º          2º         3º         4º         5º
                                    A           5           5           5          5          5
                                    B           3           4           5          6          7
                                    C           1           3           5          7          9
                                    D           1           1           1          1         21

                                Se analisarmos as médias dos salários pagos por cada uma das
                       empresas veremos que em média eles pagam 5 salários para seus funcionários,
                       mas se olharmos com mais cuidado, vemos que nos casos onde há maior
                       discrepância nos dados, a média não representa a distribuição dos mesmos. Por
                       outro lado, a mediana pode ser obtida através de um conjunto ordenado de
                       dados e não será influenciada por valores extremos.
                 o     Ao somarmos ou subtrairmos uma constante a um conjunto de valores de uma
                       variável x, a média desse novo conjunto ficará somada ou subtraída deste
                       constante.

                 o     Ao multiplicarmos ou dividirmos os valores de um conjunto de dados, a média
                       desse novo conjunto ficará multiplicada ou dividida por esta constante.

   Separatrizes:

            Outras medidas também são muito utilizadas para observar as características dos dados.
    Estas medidas são chamadas de separatrizes, e dividem-se em:

        o   Quartis: Colocados os dados em ordem crescente, os quartis ( Qi ) são os valores que
            dividem o conjunto de dados em quatro partes iguais, cada uma contendo 25% do
            total. Assim,
Q1       Q2  ~
                                                        x                     Q3

                         0            25%            50%                  75%             100%
                  Onde, Q1 é o primeiro quartil, Q2 é o segundo quartil, e coincide com a mediana, Q3 é o
    terceiro quartil,        é o valor que atinge todos o conjunto de observações..


             o    Decis: Colocados os dados em ordem crescente, os decis ( Di ) são os valores que
                  dividem o conjunto de dados em dez partes iguais, cada uma contendo 10% do total.
                  Assim,

                               D1 ... D3 ... D5  ~
                                                  x                     ...         D8 ... D10

                         0     10% ... 30% ...        50%         ...           80% ... 100%

                  Onde,       D1 é o primeiro decil, D2 é o segundo decil, (...), D10 : é o décimo decil.

             o    Percentis: Colocados os dados em ordem crescente, os percentis ( Pi ) são os valores
                  que dividem o conjunto de dados em cem partes iguais, cada uma contendo 1% do
                  total. Assim,

                        P1 P2       ...            P50  ~
                                                         x                    ...       P99 P100

                        0 1%         ...           50%            ...                  99% 100%

                  Onde, P : é o primeiro percentil, P2 : é o segundo percentil, (...), P : é o décimo
                         1                                                              100
        percentil;


Medidas de dispersão:

                 As medidas de dispersão visam descrever os dados no sentido de informar o grau de
dispersão ou afastamento dos valores observados em torno da média. Elas informam se um conjunto de
dados é homogêneo (pouca variabilidade) ou heterogêneo (muita variabilidade).
                 Na prática, existem vária medidas que expressam a variabilidade de um conjunto de
dados, sendo que as mais utilizadas baseiam-se na idéia que consiste em verificar a distância de cada
valor observado em relação á média. Estas distâncias são denominadas desvios em relação à média.

       VARIÂNCIA

         A variância representa a média dos quadrados das distâncias entre os valores originais e a média
aritmética. Sua unidade é, portanto, o quadrado da unidade da variável. Dessa forma, se a unidade da
variável for, por exemplo, metros (m), teremos como resultado algum valor em metros quadrados (m2).
         Consideremos uma população finita, de tamanho N. Seja n o tamanho de uma amostra, retirada
desta população. Assim, temos

       Conjunto de dados amostrais:           x1 , x2 ,..., xn
       Conjunto de dados populacionais:            x1 , x2 ,..., x N
       Fórmulas básicas:
 2 ( x1  x ) 2  ( x 2  x ) 2    ( x n  x ) 2      1 n
                   S 
                                            n 1
                                                                                 ( xi  x ) 2
                                                                           n  1 i 1
                                                                                               ,
                    2  ( x1   )  ( x 2   )    ( x N   )  1
                                    2              2                    2       N

                   
                                               N
                                                                                 ( xi   )
                                                                             N i 1
                                                                                             2




Onde:

         : indica a adição de um conjunto de valores (somatório);
x : é a variável, em geral usada para representar os valores individuais dos dados;
x : é média amostral do conjunto de dados;
 : é média populacional do conjunto de dados;
n : número de valores na amostra;
N : número de valores na população;
S 2 : variância do conjunto de valores AMOSTRAIS;
 2 : variância de todos os valores existentes na POPULAÇÃO;

        Vamos supor que as observações não são todas distintas, ou seja, há repetições de valores, de
forma que existam:

            n1 observações iguais a x1
            n 2 observações iguais a x 2
             
            n k observações iguais a x k

            Então, temos que


                 n1 ( x1  x ) 2  n2 ( x2  x ) 2    nk ( xk  x ) 2     1 k
             S 
               2

                                           n 1
                                                                                ni ( xi  x ) 2 ,
                                                                           n  1 i 1
com   n1  n2    nk  n .

        Podemos observar que, ao calcularmos a variância amostral, dividimos a soma dos quadrados
dos desvios por (n  1) , e não por n , como no cálculo de outras medidas comumente utilizadas. Isto
acontece porque o fator (n  1) pode ser usado como um fator de correção, quando queremos considerar
a variância amostral como uma estimativa da variância populacional.
         OBSERVAÇÃO: Para o cálculo da variância, quando os dados estão agrupados em classes,
basta substituir os verdadeiros valores observados pelo ponto médio da classe.



            DESVIO PADRÃO

        O Desvio Padrão é a raiz quadrada da variância. Denotado por            S , o desvio padrão amostral é
dado por:


                    n1 ( x1  x ) 2  n2 ( x2  x ) 2    nk ( xk  x ) 2       1 k
S  S2 
                                              n 1
                                                                                     ni ( xi  x ) 2 ,
                                                                                n  1 i 1
com   n1  n2    nk  n .

         O uso do desvio padrão como medida de variabilidade é preferível pelo fato de ser expresso na
mesma unidade de medida dos valores observados, já que a variância pode causar problemas de
interpretação por ser expressa em termos quadráticos.
         Analogamente à variância, quanto maior for o valor do desvio padrão, maior a dispersão entre os
dados.

         O COEFICIENTE DE VARIAÇÃO DE PEARSON

         É uma medida de variabilidade que, em geral, é expressa em porcentagem, e tem por função
determinar o grau de concentração dos dados em torno da média. Por ser uma medida ADIMENSIONAL,
o coeficiente de variação é geralmente utilizado para fazer a comparação entre dois conjuntos de dados,
tendo eles mesma unidade de medida, OU NÃO. Os coeficientes de variação populacional e amostral são
dados, respectivamente, por:

                                                            S
                             CV        100%      e CV        100% .
                                                            X

        Outra informação importante fornecida pelo coeficiente de variação de Pearson é se a média é ou
não uma medida representativa para o conjunto de dados. Em geral, temos que:

                CV  50%  a média não é representativa;
                CV  50%  a média é representativa;
                CV  0  a média é significativamente representativa ( S  0) ;

Mais conteúdo relacionado

Mais procurados

Probabilidade genética
Probabilidade genética Probabilidade genética
Junqueira & Carneiro - Biologia celular e molecular - 9 Ed.pdf
Junqueira & Carneiro - Biologia celular e molecular - 9 Ed.pdfJunqueira & Carneiro - Biologia celular e molecular - 9 Ed.pdf
Junqueira & Carneiro - Biologia celular e molecular - 9 Ed.pdf
Jaqueline Silveira
 
Células
CélulasCélulas
Células
Killer Max
 
A primeira lei de mendel
A primeira lei de mendelA primeira lei de mendel
A primeira lei de mendel
mainamgar
 
Mendel e hereditariedade
Mendel e hereditariedadeMendel e hereditariedade
Mendel e hereditariedade
Adila Trubat
 
Tecnologias na Saúde
Tecnologias na SaúdeTecnologias na Saúde
Tecnologias na Saúde
Mayara Mônica
 
Consumo de Energia Elétrica
Consumo de Energia ElétricaConsumo de Energia Elétrica
Consumo de Energia Elétrica
betontem
 
SEMANA 02 - BIOLOGIA - 2ª SÉRIE - PERTURBAÇÃO AMBIENTAL
SEMANA 02 - BIOLOGIA - 2ª SÉRIE - PERTURBAÇÃO AMBIENTALSEMANA 02 - BIOLOGIA - 2ª SÉRIE - PERTURBAÇÃO AMBIENTAL
SEMANA 02 - BIOLOGIA - 2ª SÉRIE - PERTURBAÇÃO AMBIENTAL
GernciadeProduodeMat
 
Classificação dos Seres Vivos
Classificação dos Seres Vivos Classificação dos Seres Vivos
Classificação dos Seres Vivos
Leandro A. Machado de Moura
 
Aula prática apresentação do microscopio e tecidos vegetais 2012
Aula prática apresentação do microscopio e tecidos vegetais 2012Aula prática apresentação do microscopio e tecidos vegetais 2012
Aula prática apresentação do microscopio e tecidos vegetais 2012
Priscila Belintani
 
Biologia noções de probabilidade aplicadas à genética
Biologia    noções de probabilidade aplicadas à genéticaBiologia    noções de probabilidade aplicadas à genética
Biologia noções de probabilidade aplicadas à genética
Adrianne Mendonça
 
Bio aulas praticas
Bio aulas praticasBio aulas praticas
1ª aula biologia celular
1ª aula biologia celular1ª aula biologia celular
1ª aula biologia celular
Flávio Silva
 
Doenças genéticas: Síndromes
Doenças genéticas: SíndromesDoenças genéticas: Síndromes
Doenças genéticas: Síndromes
Matheus Fellipe
 
Meio ambiente e ecologia: conceitos.
Meio ambiente e ecologia: conceitos.Meio ambiente e ecologia: conceitos.
Meio ambiente e ecologia: conceitos.
Roney Gusmão
 
Composição química dos seres vivos
Composição química dos seres vivosComposição química dos seres vivos
Composição química dos seres vivos
Eldon Clayton
 
Efeitos Biológicos da Radiação não Ionizante.
Efeitos Biológicos da Radiação não Ionizante.Efeitos Biológicos da Radiação não Ionizante.
Efeitos Biológicos da Radiação não Ionizante.
Rafael Lunelli
 
Energias
EnergiasEnergias
Divisão celular mitose e meiose
Divisão celular  mitose e meioseDivisão celular  mitose e meiose
Divisão celular mitose e meiose
César Milani
 
Aula 8 ciclo celular mitose e meiose
Aula 8   ciclo celular mitose e meioseAula 8   ciclo celular mitose e meiose
Aula 8 ciclo celular mitose e meiose
MARCIAMP
 

Mais procurados (20)

Probabilidade genética
Probabilidade genética Probabilidade genética
Probabilidade genética
 
Junqueira & Carneiro - Biologia celular e molecular - 9 Ed.pdf
Junqueira & Carneiro - Biologia celular e molecular - 9 Ed.pdfJunqueira & Carneiro - Biologia celular e molecular - 9 Ed.pdf
Junqueira & Carneiro - Biologia celular e molecular - 9 Ed.pdf
 
Células
CélulasCélulas
Células
 
A primeira lei de mendel
A primeira lei de mendelA primeira lei de mendel
A primeira lei de mendel
 
Mendel e hereditariedade
Mendel e hereditariedadeMendel e hereditariedade
Mendel e hereditariedade
 
Tecnologias na Saúde
Tecnologias na SaúdeTecnologias na Saúde
Tecnologias na Saúde
 
Consumo de Energia Elétrica
Consumo de Energia ElétricaConsumo de Energia Elétrica
Consumo de Energia Elétrica
 
SEMANA 02 - BIOLOGIA - 2ª SÉRIE - PERTURBAÇÃO AMBIENTAL
SEMANA 02 - BIOLOGIA - 2ª SÉRIE - PERTURBAÇÃO AMBIENTALSEMANA 02 - BIOLOGIA - 2ª SÉRIE - PERTURBAÇÃO AMBIENTAL
SEMANA 02 - BIOLOGIA - 2ª SÉRIE - PERTURBAÇÃO AMBIENTAL
 
Classificação dos Seres Vivos
Classificação dos Seres Vivos Classificação dos Seres Vivos
Classificação dos Seres Vivos
 
Aula prática apresentação do microscopio e tecidos vegetais 2012
Aula prática apresentação do microscopio e tecidos vegetais 2012Aula prática apresentação do microscopio e tecidos vegetais 2012
Aula prática apresentação do microscopio e tecidos vegetais 2012
 
Biologia noções de probabilidade aplicadas à genética
Biologia    noções de probabilidade aplicadas à genéticaBiologia    noções de probabilidade aplicadas à genética
Biologia noções de probabilidade aplicadas à genética
 
Bio aulas praticas
Bio aulas praticasBio aulas praticas
Bio aulas praticas
 
1ª aula biologia celular
1ª aula biologia celular1ª aula biologia celular
1ª aula biologia celular
 
Doenças genéticas: Síndromes
Doenças genéticas: SíndromesDoenças genéticas: Síndromes
Doenças genéticas: Síndromes
 
Meio ambiente e ecologia: conceitos.
Meio ambiente e ecologia: conceitos.Meio ambiente e ecologia: conceitos.
Meio ambiente e ecologia: conceitos.
 
Composição química dos seres vivos
Composição química dos seres vivosComposição química dos seres vivos
Composição química dos seres vivos
 
Efeitos Biológicos da Radiação não Ionizante.
Efeitos Biológicos da Radiação não Ionizante.Efeitos Biológicos da Radiação não Ionizante.
Efeitos Biológicos da Radiação não Ionizante.
 
Energias
EnergiasEnergias
Energias
 
Divisão celular mitose e meiose
Divisão celular  mitose e meioseDivisão celular  mitose e meiose
Divisão celular mitose e meiose
 
Aula 8 ciclo celular mitose e meiose
Aula 8   ciclo celular mitose e meioseAula 8   ciclo celular mitose e meiose
Aula 8 ciclo celular mitose e meiose
 

Destaque

4. probabilidade (1)
4. probabilidade (1)4. probabilidade (1)
4. probabilidade (1)
Thiago Apolinário
 
Estatística
EstatísticaEstatística
Estatística
turma8bjoaofranco
 
Adaptações neuromusculares ao exercício físico síntese de uma
Adaptações neuromusculares ao exercício físico síntese de umaAdaptações neuromusculares ao exercício físico síntese de uma
Adaptações neuromusculares ao exercício físico síntese de uma
Thiago Apolinário
 
Medidas De TendêNcia Central
Medidas De TendêNcia CentralMedidas De TendêNcia Central
Medidas De TendêNcia Central
naianeufu1
 
II Torneio de Poker CRSSC
II Torneio de Poker CRSSCII Torneio de Poker CRSSC
II Torneio de Poker CRSSC
Joana Forte
 
Medidas de dispersão
Medidas de dispersãoMedidas de dispersão
Medidas de dispersão
paulocsm
 
Medidas de dispersão
Medidas de dispersãoMedidas de dispersão
Estatística, Medidas de dispersão e medidas de posição
Estatística, Medidas de dispersão e medidas de posiçãoEstatística, Medidas de dispersão e medidas de posição
Estatística, Medidas de dispersão e medidas de posição
nelsonpoer
 
Medidas de Tendência Central e Dispersão
Medidas de Tendência Central e DispersãoMedidas de Tendência Central e Dispersão
Medidas de Tendência Central e Dispersão
Wanderson Oliveira
 
Aula 04 séries estatísticas
Aula 04   séries estatísticasAula 04   séries estatísticas
Estatística - Aula 2 - Estatística descritiva
Estatística - Aula 2 - Estatística descritivaEstatística - Aula 2 - Estatística descritiva
Estatística - Aula 2 - Estatística descritiva
Helder Lopes
 
Desvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrõesDesvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrões
Gabriel Passeri
 
1 estatística descritiva, distribuição de frequência v discreta e continua
1   estatística descritiva, distribuição de frequência v discreta e continua1   estatística descritiva, distribuição de frequência v discreta e continua
1 estatística descritiva, distribuição de frequência v discreta e continua
Nilson Costa
 
Estatística
EstatísticaEstatística
Estatística
Sonia Azevedo
 
Estatística completa
Estatística completaEstatística completa
Estatística completa
Ronne Seles
 
Estatística
EstatísticaEstatística
Estatística
giselesilvaramos
 

Destaque (16)

4. probabilidade (1)
4. probabilidade (1)4. probabilidade (1)
4. probabilidade (1)
 
Estatística
EstatísticaEstatística
Estatística
 
Adaptações neuromusculares ao exercício físico síntese de uma
Adaptações neuromusculares ao exercício físico síntese de umaAdaptações neuromusculares ao exercício físico síntese de uma
Adaptações neuromusculares ao exercício físico síntese de uma
 
Medidas De TendêNcia Central
Medidas De TendêNcia CentralMedidas De TendêNcia Central
Medidas De TendêNcia Central
 
II Torneio de Poker CRSSC
II Torneio de Poker CRSSCII Torneio de Poker CRSSC
II Torneio de Poker CRSSC
 
Medidas de dispersão
Medidas de dispersãoMedidas de dispersão
Medidas de dispersão
 
Medidas de dispersão
Medidas de dispersãoMedidas de dispersão
Medidas de dispersão
 
Estatística, Medidas de dispersão e medidas de posição
Estatística, Medidas de dispersão e medidas de posiçãoEstatística, Medidas de dispersão e medidas de posição
Estatística, Medidas de dispersão e medidas de posição
 
Medidas de Tendência Central e Dispersão
Medidas de Tendência Central e DispersãoMedidas de Tendência Central e Dispersão
Medidas de Tendência Central e Dispersão
 
Aula 04 séries estatísticas
Aula 04   séries estatísticasAula 04   séries estatísticas
Aula 04 séries estatísticas
 
Estatística - Aula 2 - Estatística descritiva
Estatística - Aula 2 - Estatística descritivaEstatística - Aula 2 - Estatística descritiva
Estatística - Aula 2 - Estatística descritiva
 
Desvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrõesDesvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrões
 
1 estatística descritiva, distribuição de frequência v discreta e continua
1   estatística descritiva, distribuição de frequência v discreta e continua1   estatística descritiva, distribuição de frequência v discreta e continua
1 estatística descritiva, distribuição de frequência v discreta e continua
 
Estatística
EstatísticaEstatística
Estatística
 
Estatística completa
Estatística completaEstatística completa
Estatística completa
 
Estatística
EstatísticaEstatística
Estatística
 

Semelhante a 3. medidas de posição e dispersão (1)

Aula 07 Medidas de Tendencia Central de Dados Não Agrupados
Aula 07   Medidas de Tendencia Central de Dados Não AgrupadosAula 07   Medidas de Tendencia Central de Dados Não Agrupados
Aula 07 Medidas de Tendencia Central de Dados Não Agrupados
João Alessandro da Luz, Secretaria de Estado da Educação do Paraná, Campo Mourão - Pr
 
Moda, mediana e média
Moda, mediana e médiaModa, mediana e média
Moda, mediana e média
Curso Técnicas de Apoio à Gestao
 
Mdesc
MdescMdesc
topico 2_Medidas descritivas.pdf
topico 2_Medidas descritivas.pdftopico 2_Medidas descritivas.pdf
topico 2_Medidas descritivas.pdf
GilvanaCoelhoPenedo1
 
Estatística10
Estatística10Estatística10
Estatística10
Catia Rosa
 
Raciocinio logico.pptx
Raciocinio logico.pptxRaciocinio logico.pptx
Raciocinio logico.pptx
IagoBernard1
 
aula1_slides.pdf
aula1_slides.pdfaula1_slides.pdf
aula1_slides.pdf
MiltonManjate1
 
Sps02 tendenciacentral
Sps02 tendenciacentralSps02 tendenciacentral
Sps02 tendenciacentral
Verenaamaral
 
Conceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística II
Vitor Vieira Vasconcelos
 
Tratamento e Organização de Dados
Tratamento e Organização de DadosTratamento e Organização de Dados
Tratamento e Organização de Dados
estudamatematica
 
Probabilidade e Estatística - Aula 03
Probabilidade e Estatística - Aula 03Probabilidade e Estatística - Aula 03
Probabilidade e Estatística - Aula 03
Augusto Junior
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
Mitsubishi Motors Brasil
 
GráFico De Setores
GráFico De SetoresGráFico De Setores
GráFico De Setores
naianeufu1
 
Organização e Tratamento de Dados
Organização e Tratamento de Dados Organização e Tratamento de Dados
Organização e Tratamento de Dados
estudamatematica
 
Capítulo iv medidas de tendência central
Capítulo iv   medidas de tendência centralCapítulo iv   medidas de tendência central
Capítulo iv medidas de tendência central
con_seguir
 
Medidas de centralidade
Medidas de centralidadeMedidas de centralidade
Medidas de centralidade
Andréa Thees
 
Tq7
Tq7Tq7
Distribuição normal
Distribuição normalDistribuição normal
Material estatística
Material estatísticaMaterial estatística
Material estatística
Adriano Araújo
 
Qualidade Estudo De Meta
Qualidade Estudo De MetaQualidade Estudo De Meta
Qualidade Estudo De Meta
Rubia Soraya Rabello
 

Semelhante a 3. medidas de posição e dispersão (1) (20)

Aula 07 Medidas de Tendencia Central de Dados Não Agrupados
Aula 07   Medidas de Tendencia Central de Dados Não AgrupadosAula 07   Medidas de Tendencia Central de Dados Não Agrupados
Aula 07 Medidas de Tendencia Central de Dados Não Agrupados
 
Moda, mediana e média
Moda, mediana e médiaModa, mediana e média
Moda, mediana e média
 
Mdesc
MdescMdesc
Mdesc
 
topico 2_Medidas descritivas.pdf
topico 2_Medidas descritivas.pdftopico 2_Medidas descritivas.pdf
topico 2_Medidas descritivas.pdf
 
Estatística10
Estatística10Estatística10
Estatística10
 
Raciocinio logico.pptx
Raciocinio logico.pptxRaciocinio logico.pptx
Raciocinio logico.pptx
 
aula1_slides.pdf
aula1_slides.pdfaula1_slides.pdf
aula1_slides.pdf
 
Sps02 tendenciacentral
Sps02 tendenciacentralSps02 tendenciacentral
Sps02 tendenciacentral
 
Conceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística II
 
Tratamento e Organização de Dados
Tratamento e Organização de DadosTratamento e Organização de Dados
Tratamento e Organização de Dados
 
Probabilidade e Estatística - Aula 03
Probabilidade e Estatística - Aula 03Probabilidade e Estatística - Aula 03
Probabilidade e Estatística - Aula 03
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
GráFico De Setores
GráFico De SetoresGráFico De Setores
GráFico De Setores
 
Organização e Tratamento de Dados
Organização e Tratamento de Dados Organização e Tratamento de Dados
Organização e Tratamento de Dados
 
Capítulo iv medidas de tendência central
Capítulo iv   medidas de tendência centralCapítulo iv   medidas de tendência central
Capítulo iv medidas de tendência central
 
Medidas de centralidade
Medidas de centralidadeMedidas de centralidade
Medidas de centralidade
 
Tq7
Tq7Tq7
Tq7
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Material estatística
Material estatísticaMaterial estatística
Material estatística
 
Qualidade Estudo De Meta
Qualidade Estudo De MetaQualidade Estudo De Meta
Qualidade Estudo De Meta
 

3. medidas de posição e dispersão (1)

  • 1. Universidade Estadual da Paraíba Disciplina: Biometria Professora: Nyedja Fialho M. Barbosa Assunto: Medidas de Posição e Dispersão Medidas de variáveis utilizadas em Estatísticas: Medidas de tendência Central ou Posição: Buscam evidenciar o comportamento central de uma variável. Dentre as mais utilizadas destacam-se:  Moda: o Definição: moda é o valor mais frequente na amostra. o Notação:  Observações:  Quando DOIS VALORES ocorrem com a mesma maior frequência, cada um deles é uma moda, e o conjunto de dados é dito BIMODAL;  Quando MAIS DE DOIS VALORES ocorre com a mesma maior frequência, cada um deles é uma moda, e o conjunto de dados é dito MULTIMODAL;  Quando NENHUM VALOR se repete com maior frequência, dizemos que não há moda, e o conjunto de dados é dito AMODAL.  Mediana: o Definição: Mediana é o valor da variável que particiona a amostra ao meio. Isto é, o valor que deixa abaixo de si 50% das observações. o Notação: ou ~ x 0 50% 100% o Fórmulas:  Média aritmética: o Definição: média o valor dado pela soma de todos os valores da amostra, dividida pelo número desses valores.
  • 2. o Notação: o Fórmulas:  x  x2    xn 1 1 n  x 1  x1  x 2    x n    xi  n n n i 1  ,   x1  x 2    x N  1 x  x    x   1 N   N N 1 2 N  xi N i 1 Onde:  : indica a adição de um conjunto de valores (somatório); x : é a variável usada para representar os valores individuais dos dados; n : número de valores na amostra; N : número de valores na população; x : média do conjunto de valores AMOSTRAIS;  : média de todos os valores existentes na POPULAÇÃO;  Propriedades da média: o A média é altamente influenciada por valores extremos. Nem sempre poderá ser utilizada como medida que resuma adequadamente um conjunto de dados, visto que esta não carrega em si a noção de variabilidade.  Exemplo: Tabela 1: Número de salários de cinco funcionários das empresas A, B, C e D, escolhidos ao acaso. Funcionários Empresas 1º 2º 3º 4º 5º A 5 5 5 5 5 B 3 4 5 6 7 C 1 3 5 7 9 D 1 1 1 1 21 Se analisarmos as médias dos salários pagos por cada uma das empresas veremos que em média eles pagam 5 salários para seus funcionários, mas se olharmos com mais cuidado, vemos que nos casos onde há maior discrepância nos dados, a média não representa a distribuição dos mesmos. Por outro lado, a mediana pode ser obtida através de um conjunto ordenado de dados e não será influenciada por valores extremos. o Ao somarmos ou subtrairmos uma constante a um conjunto de valores de uma variável x, a média desse novo conjunto ficará somada ou subtraída deste constante. o Ao multiplicarmos ou dividirmos os valores de um conjunto de dados, a média desse novo conjunto ficará multiplicada ou dividida por esta constante.  Separatrizes: Outras medidas também são muito utilizadas para observar as características dos dados. Estas medidas são chamadas de separatrizes, e dividem-se em: o Quartis: Colocados os dados em ordem crescente, os quartis ( Qi ) são os valores que dividem o conjunto de dados em quatro partes iguais, cada uma contendo 25% do total. Assim,
  • 3. Q1 Q2  ~ x Q3 0 25% 50% 75% 100% Onde, Q1 é o primeiro quartil, Q2 é o segundo quartil, e coincide com a mediana, Q3 é o terceiro quartil, é o valor que atinge todos o conjunto de observações.. o Decis: Colocados os dados em ordem crescente, os decis ( Di ) são os valores que dividem o conjunto de dados em dez partes iguais, cada uma contendo 10% do total. Assim, D1 ... D3 ... D5  ~ x ... D8 ... D10 0 10% ... 30% ... 50% ... 80% ... 100% Onde, D1 é o primeiro decil, D2 é o segundo decil, (...), D10 : é o décimo decil. o Percentis: Colocados os dados em ordem crescente, os percentis ( Pi ) são os valores que dividem o conjunto de dados em cem partes iguais, cada uma contendo 1% do total. Assim, P1 P2 ... P50  ~ x ... P99 P100 0 1% ... 50% ... 99% 100% Onde, P : é o primeiro percentil, P2 : é o segundo percentil, (...), P : é o décimo 1 100 percentil; Medidas de dispersão: As medidas de dispersão visam descrever os dados no sentido de informar o grau de dispersão ou afastamento dos valores observados em torno da média. Elas informam se um conjunto de dados é homogêneo (pouca variabilidade) ou heterogêneo (muita variabilidade). Na prática, existem vária medidas que expressam a variabilidade de um conjunto de dados, sendo que as mais utilizadas baseiam-se na idéia que consiste em verificar a distância de cada valor observado em relação á média. Estas distâncias são denominadas desvios em relação à média.  VARIÂNCIA A variância representa a média dos quadrados das distâncias entre os valores originais e a média aritmética. Sua unidade é, portanto, o quadrado da unidade da variável. Dessa forma, se a unidade da variável for, por exemplo, metros (m), teremos como resultado algum valor em metros quadrados (m2). Consideremos uma população finita, de tamanho N. Seja n o tamanho de uma amostra, retirada desta população. Assim, temos  Conjunto de dados amostrais: x1 , x2 ,..., xn  Conjunto de dados populacionais: x1 , x2 ,..., x N  Fórmulas básicas:
  • 4.  2 ( x1  x ) 2  ( x 2  x ) 2    ( x n  x ) 2 1 n S   n 1   ( xi  x ) 2 n  1 i 1  ,  2  ( x1   )  ( x 2   )    ( x N   )  1 2 2 2 N   N  ( xi   ) N i 1 2 Onde:  : indica a adição de um conjunto de valores (somatório); x : é a variável, em geral usada para representar os valores individuais dos dados; x : é média amostral do conjunto de dados;  : é média populacional do conjunto de dados; n : número de valores na amostra; N : número de valores na população; S 2 : variância do conjunto de valores AMOSTRAIS;  2 : variância de todos os valores existentes na POPULAÇÃO; Vamos supor que as observações não são todas distintas, ou seja, há repetições de valores, de forma que existam:  n1 observações iguais a x1  n 2 observações iguais a x 2   n k observações iguais a x k Então, temos que n1 ( x1  x ) 2  n2 ( x2  x ) 2    nk ( xk  x ) 2 1 k S  2 n 1   ni ( xi  x ) 2 , n  1 i 1 com n1  n2    nk  n . Podemos observar que, ao calcularmos a variância amostral, dividimos a soma dos quadrados dos desvios por (n  1) , e não por n , como no cálculo de outras medidas comumente utilizadas. Isto acontece porque o fator (n  1) pode ser usado como um fator de correção, quando queremos considerar a variância amostral como uma estimativa da variância populacional. OBSERVAÇÃO: Para o cálculo da variância, quando os dados estão agrupados em classes, basta substituir os verdadeiros valores observados pelo ponto médio da classe.  DESVIO PADRÃO O Desvio Padrão é a raiz quadrada da variância. Denotado por S , o desvio padrão amostral é dado por: n1 ( x1  x ) 2  n2 ( x2  x ) 2    nk ( xk  x ) 2 1 k S  S2  n 1   ni ( xi  x ) 2 , n  1 i 1
  • 5. com n1  n2    nk  n . O uso do desvio padrão como medida de variabilidade é preferível pelo fato de ser expresso na mesma unidade de medida dos valores observados, já que a variância pode causar problemas de interpretação por ser expressa em termos quadráticos. Analogamente à variância, quanto maior for o valor do desvio padrão, maior a dispersão entre os dados.  O COEFICIENTE DE VARIAÇÃO DE PEARSON É uma medida de variabilidade que, em geral, é expressa em porcentagem, e tem por função determinar o grau de concentração dos dados em torno da média. Por ser uma medida ADIMENSIONAL, o coeficiente de variação é geralmente utilizado para fazer a comparação entre dois conjuntos de dados, tendo eles mesma unidade de medida, OU NÃO. Os coeficientes de variação populacional e amostral são dados, respectivamente, por:  S CV   100% e CV   100% .  X Outra informação importante fornecida pelo coeficiente de variação de Pearson é se a média é ou não uma medida representativa para o conjunto de dados. Em geral, temos que:  CV  50%  a média não é representativa;  CV  50%  a média é representativa;  CV  0  a média é significativamente representativa ( S  0) ;