SlideShare uma empresa Scribd logo
1 de 50
MÉTODOS ESTATÍSTICOS
    E NUMÉRICOS

            UNIDADE 2

MEDIDAS DE CENTRALIZACIÓN E
         POSICIÓN

                      ÍNDICE
   IES Isidro Parga Pondal. Departamento de matemáticas
Conceptos

1. Parámetros de centralización: media,
   mediana e moda.
2. Parámetros de dispersión: rango, varianza,
   desviación típica.
3. Utilización conxunta de media e desviación
   típica.
4. Medidas de posición non central: cuartís,
   decís, percentís.



            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización



 Este tipo de parámetros proporciónannos
 uns valores en torno ós que se centran os
 datos da distribución.
 Os principais son:
         Media aritmética
         Mediana
         Moda




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización


Veremos tamén:
   –   media   aritmética ponderada
   –   media   a. Recortada
   –   media   a. truncada ou Winsorizada,
   –   media   cuadrática
   –   media   xeométrica
   –   media   harmónica.



               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

 Media aritmética
A media aritmética dunha variable estatística é o
cociente entre a suma de todos os valores de dita
variable e o número destes.

 Fórmula para datos agrupados nunha táboa estatística:
                             _
                            x=
                               ∑x ⋅ f              i        i

                                                N

            xi = valor da variable ou marca de clase
            fi = frecuencia absoluta
            N = nº de datos
            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

 Media aritmética ponderada:
Emprégase para calcular o promedio duns valores
cando estes teñen diferentes ponderacións ou pesos.
Se unha variable estatística toma valores x1, x2,…,xn
con pesos w1, w2, …, wn respectivamente defínese a
media aritmética ponderada como:
                                         n

                                      ∑ x
                                       w             i       i
                         x = i =n
                                1


                                         ∑w
                                          i=1
                                                         i




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

 Media recortada R(p)
Se temos unha serie de n datos ordenados,X1,X2,…,Xn,
defínese a media recortada nunha porcentaxe p como
a media aritmética deses datos onde se suprimen en
ambos os extremos os correspondentes á porcentaxe p.
Se suprimimos a datos por ambos extremos, teremos
que a media recortada ó p% é:
                                         n −a

                                         ∑X             i
               R ( p ) = i =1+a
                         n − 2a

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

 Media truncada ou Winsorizada W(p):
Se temos unha serie de n datos ordenados,X1,X2,…,Xn,
defínese a media truncada ou Winsorizada nunha
porcentaxe p como a media aritmética deses datos
onde se substitúen en ambos os extremos os datos
correspondentes á porcentaxe p polo máis preto dese
extremo.




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

 Media cuadrática
Emprégase cando a variable toma valores positivos e
negativos e non queremos que a medida de tendencia
central reflicta os efectos do signo. É moi práctica
cando traballamos con erros na medida dunha
magnitude. Desígnase por C e a súa expresión para
datos agrupados é:
                                                      n

                                                   ∑ i ⋅ fi
                                                                  2
                                                    x
                                 C=                 i=1
                                                              N

 xi = valor da variable ou marca de clase
 fi = frecuencia absoluta
 N = nº de datos


                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

Media Xeométrica:
Utilízase cando calculamos números índices sintéticos
(combinan unha grande cantidade de prezos e
producións, como o IPC). Non se pode usar cando hai
valores negativos. Desígnase por G, e a súa expresión
para datos agrupados é:

                                          f1           f2                   fn
                    G=          N
                                     x1 ⋅ x2 ⋅ ... ⋅ xn
 xi = valor da variable ou marca de clase
 fi = frecuencia absoluta
 N = nº de datos



               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

Media Harmónica:
É a inversa da media aritmética dos inversos dos
valores da variable. É útil na comparación de
velocidades promedio sobre varias distancias e na
resolución de problemas estatísticos de transporte.
Designase por H, e a súa fórmula para datos agrupados
é:                          N
                      H =              n
                                        1
                                    ∑x f i
                                    i=1  i

 xi = valor da variable ou marca de clase
 fi = frecuencia absoluta
 N = nº de datos
            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

Exemplo (media aritmética-media aritmética ponderada)

Un alumno obtivo en tres exames as seguintes notas: 4-5-6.
A nota media, se as tres tivesen a mesma importancia sería:

                              _
                              x=
                                   ∑x ⋅ f i     i
                                                    =
                                                        4+5+6
                                                              =5
                                        N                 3
En cambio, se o profesor lle dá ás notas dos exames distintas
ponderacións, por exemplo: 3-2-1 respectivamente, a nota media ponderada
sería agora:
                n

               ∑w x     i i
                                3 ⋅ 4 + 2 ⋅ 5 + 1⋅ 6
          x=   i =1
                              =                      = 4,67
                  n
                                     3 + 2 +1
               ∑w
                i =1
                         i



                    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

  Exemplo (media aritmética-media harmónica)
                                                                                                     e 120
  AB=120km.          A                         B velocidade media=30Km/h ⇒                        t=   =   = 4h
                                                                                                     v 30
                                                                                                      e 120
                     B                         A velocidade media=60Km/h ⇒                         t= =     = 2h
                                                                                                      v 60
  Acha a velocidade media da viaxe completa:


  A velocidade media da viaxe sería:
                                                          distancia total 240
                                                    v=                   =    = 40km / h
                                                           tempo total     6
  Este promedio correspóndese coa media harmónica:

                             N      2
           H =                  =       = 40km / h
                          n
                             1    1   1
                         ∑x f i 30 + 60
                         i=1  i

  Se se considerara a media aritmética das velocidades, obteríamos:

   _
   x=
        ∑x ⋅ f
           i     i
                     =
                         30 + 60
                                 = 45km / h                   Que é incorrecto!!!
          N                 2
                           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Tipos de media.

  Exemplo: Dada a serie estatística: 1- 4- 6- 6- 8- 8- 10- 12- 14- 30, imos achar a media
  recortada ao 10% e a media winsorizada ao 10%.

  MEDIA RECORTADA ao 10%: o 10% de 10 é 1 e eliminamos 1 dato por cada extremo.
  Calculamos a media aritmética dos 8 datos restantes:
                                                                   n−a              10 −1

                                                                   ∑X       i       ∑X       i
                                                                                                     4 + 6 + 6 + 8 + 8 + 10 + 12 + 14
 1 4 6 6 8 8 10 12 14 30 ⇒ R (10) =                               i =1+ a
                                                                                =   i =1+1
                                                                                                 =                                    = 8,5
                                                                  n − 2a            10 − 2                           8


 MEDIA WINSORIZADA ao 10%: substituímos os datos extremos polos datos máis próximos a
 eles, e calculamos a media da serie:

                                                               4 + 4 + 6 + 6 + 8 + 8 + 10 + 12 + 14 + 14
  4 4 6 6 8 8 10 12 14 14 ⇒                      W (10) =                                                = 8,6
                                                                                  10

 Obsérvase que estes valores difiren bastante da media aritmética:
  _
  x=
       ∑x ⋅ f
          i     i
                    =
                        1 + 4 + 6 ⋅ 2 + 8 ⋅ 2 + 10 + 12 + 14 + 30
                                                                  = 9,9                          debido a que hai un valor atípico:
  30     N                                   10
                            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Media aritmética.

Exemplo variable discreta
Nunha poboación de 25 familias observouse a variable número de coches
que ten a familia, e obtivéronse os seguintes datos:
       0123101114322112211121321

     Xi     fi            xi⋅fi
     0      2               0
     1      12             12
     2      7              14
                                                 _
                                                 x=
                                                    ∑x ⋅ f         i      i
                                                                              =
                                                                                39
                                                                                   = 1,56
     3      3               9                                    N              25
     4       1              4
          N=25             39


                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Media aritmética.

 Vexamos un exemplo gráfico de variable discreta obtido da páxina
 do ITE.




              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Media aritmética.

  Exemplo variable continua

  Unha estación meteorolóxica
  rexistrou 88 días de choiva
  o pasado ano, segundo se mostra
  na seguinte táboa:




Litros/m2    [0,5)         [5,10)           [10,15)          [15,20)          [20,25)           [25,30)     [30,35)


Nº de días    3               7                19               23                18                12        6

  Completemos a táboa:


                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Media aritmética.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Media aritmética.

     Litros/m2                   Marcas (xi)                                fi                               xi⋅fi
       [0,5)                            2,5                                 3                                7,5
      [5,10)                            7,5                                 7                               52,5
      [10,15)                           12,5                               19                              237,5
      [15,20)                           17,5                               23                              402,5
     [20,25)                           22,5                                18                               405
     [25,30)                           27,5                                12                               330
     [30,35)                           32,5                                 6                                195
                                                                         N=88                              1630
 _
 x=
    ∑x ⋅ f
         i     i
                   =
                       1630
                            = 18,52 litros / m 2
        N               88

                         IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1.-Parámetros de centralización: Mediana.



 A mediana Me dunha variable estatística é o valor de
 dita variable tal que o número de valores menores ca el
 é igual ó número de valores maiores ca el. Ou dito
 doutro xeito, é o valor tal que, ordenados os valores en
 orde crecente ou decrecente ocupa a posición central.




             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Mediana.

• Cálculo da mediana nas variables discretas:
• Se N é impar e os datos son simples a Mediana é o valor que
  ocupa o lugar (N+1)/2.
      Exemplo: 1,4,6,7,8,10,13,16,20, 24,25,27,30 N=13
                               ocupa a posición central ⇒ Me=13

• Se N é par e os datos son simples hai dous valores centrais e a
  mediana será a media aritmética dos valores que ocupan os
  postos N/2 e N/2 + 1.
      Exemplo: 1,4,6,7,8,10,13,16,20,24,25,27       N=12
                               ocupan as posicións centrais
        10 + 13
   Me =         = 11,5
           2



               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Mediana.


•   Cálculo da mediana nas variables discretas:

 Se os datos están tabulados nunha táboa de
 frecuencias, a mediana é o primeiro valor da variable
 estatística no que a frecuencia absoluta acumulada
 supere a metade dos datos.

 Se a metade dos datos coincide con algunha frecuencia
 absoluta acumulada , a mediana sería a media
 aritmética dese valor e o seguinte na táboa.


             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Mediana


 • Cálculo da mediana nas variables continuas (ou
   para datos agrupados):

  Intervalo mediano ou clase mediana [Li-1,Li]: O
  primeiro no que a frecuencia absoluta acumulada
  supere a metade dos datos
                               N
  Mediana:                       − Fi −1
                                          Me = Li − 1 + 2                 ⋅ ei
                                                                  fi

      Li-1=límite inferior da clase mediana
      Fi-1=frecuencia absoluta acumulada da clase anterior a mediana.
      fi=frecuencia absoluta da clase mediana
      N=nº de datos
      ei=lonxitude das clases ou intervalos


                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Mediana.

 Exemplo variable discreta
                                                                                         xi           fi   Fi

 Voltamos ao exemplo de nº de coches por                                                 0            2    2
 familia:
                                                                                         1        12       14
 -Completamos a táboa calculando as Fi
                                                                                         2            7    21
 N=25 impar ⇒ (N+1)/2 = 26/2= 13                                                         3            3    24
 - Observamos cal é a primeira frecuencia
 absoluta acumulada que supera este valor                                                4            1    25
 e correspóndese co xi = 1.                                                                       25       25


 Por tanto, mediana=1
            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Mediana.

 Exemplo variable continua                                     Litros/m              Marca               fi     Fi
 Voltando ao exemplo da                                              2
                                                                                     s (xi)
 estación meterolóxica:
                                                                   [0,5)                2,5              3      3
                                                                  [5,10)                7,5              7      10
 O intervalo mediano é [15,20)
                                                                 [10,15)               12,5             19      29
 A mediana calcúlase:
 Li-1=15                                                        [15,20)                17,5             23      52

 Fi-1=29                                                        [20,25)               22,5              18      70

 fi=23                                                          [25,30)               27,5              12      82

 ei=5                                                           [30,35)               32,5               6      88

              N                     88                                                               N=88
                − Fi −1                − 29
Me = Li − 1 + 2         ⋅ ei = 15 + 2       ⋅ 5 = 18,26 litros / m 2
                 fi                   23
                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1.-Parámetros de centralización. Moda



 A moda dunha variable estatística, Mo , é o valor (ou
 valores) de dita variable que ten maior frecuencia
 absoluta.

• Cálculo da moda nas variables discretas:
 O valor , ou valores, da variable estatística no que a
 frecuencia absoluta sexa maior.




             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Moda

• Cálculo da moda nas Variables continuas (ou para datos
 agrupados):

   –    Intervalo modal ou clase modal [Li-1,Li]: O intervalo no que a
       frecuencia absoluta sexa maior.

   –   Moda:
                                            f i − f i −1                          D1
                       M o = Li −1 +                            ⋅ ei = Li − 1 +          ⋅ ei
                                     2 ⋅ f i − f i −1 − f i + 1                 D1 + D 2


           Li-1=límite inferior da clase modal
           fi,fi-1,fi+1=frecuencia absoluta da clase modal,anterior e posterior
           D1 =fi -fi-1      D2 = fi –fi+1
           ei=lonxitude das clases ou intervalos



                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Moda.

 Exemplo 1 (variable discreta):
                                                                                         xi       fi   Fi
 Voltamos ao exemplo de nº de coches por                                                 0         2   2
 familia:
                                                                                         1        12   14
 O valor da variable estatística no que a                                                2         7   21
 frecuencia absoluta é maior
 correspóndese co xi = 1.                                                                3         3   24

                                                                                         4         1   25
 Por tanto, moda=1
                                                                                                 25



             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Parámetros de Centralización. Moda.


 Exemplo 2 (variable continua):                                                  Litros/m2            Marcas       fi
                                                                                                       (xi)
 Voltando ao exemplo da estación                                                     [0,5)              2,5        3
 meterolóxica:                                                                      [5,10)                7,5      7
                                                                                   [10,15)               12,5      19
     O intervalo modal é [15,20)
     A mediana calcúlase:                                                          [15,20)               17,5      23
     Li-1=15                                                                       [20,25)               22,5      18
     D1=fi-fi-1=23-19=4                                                            [25,30)               27,5      12
     D2=fi-fi+1=23-18=5                                                            [30,35)               32,5      6
     ei=5
                                                                                                                  N=88

                        f i − f i −1                        D1                  4
M o = Li −1 +                             ⋅ ei = Li − 1 +          ⋅ ei = 15 +     ⋅ 5 = 17,2 litros / m 2
                2 ⋅ f i − f i −1 − f i +1                 D1 + D 2             4+5


                        IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Parámetros de dispersión:


 A parte das medidas de centralización, é necesario
 coñecer en que medida os datos numéricos están ou non
 agrupados ó redor dos valores centrais. A isto é o que
 chaman dispersión e os parámetros que miden estas
 desviacións respecto da media chámanse parámetros
 de dispersión.
      Os máis importantes son:
             • Rango
             • Desviación media
             • Varianza
             • Desviación Típica

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Parámetros de dispersión


Rango
O percorrido ou rango dunha distribución é a diferenza entre o
maior e o menor valor da variable estatística.

Desviación media
A desviación media dunha variable estatística é a media aritmética
dos valores absolutos das desviacións respecto á media.
                                                                _

                                                  ∑ x −x⋅ f
                                                          i            i
                                        Dm =        i

                                      N
xi= Valor da variable ou marca de clase fi=Frecuencia absoluta
                                                          _

      N=Nº de datos                                       x =       Media aritmética

              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Parámetros de dispersión

Varianza
A varianza dunha variable estatística é a media aritmética dos
cadrados das desviacións respecto á media.
                                    2
                              _

               ∑  xi − x  ⋅ f i
                           
                                                  ∑ xi ⋅ f i
                                                           2
                                                                         _2
           s2 = i                  =                i
                                                                    −x
                       N                                 N
xi= Valor da variable ou marca de clase                            fi=Frecuencia absoluta
                                                                     _
     N=Nº de datos                                                   x = Media aritmética

Desviación Típica

 A desviación típica é a raíz cadrada positiva da varianza.                                              s = s2


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Parámetros de dispersión

 Exemplo 1 v. discreta

 Voltamos ao exemplo de nº de coches por familia e completamos a
 táboa:
     xi       fi     Fi       xifi   xi2 fi xi − x    xi − x ⋅ f i

     0        2               2                0                0             1,56               3,12
     1       12              14               12               12             0,56               6,72
     2        7              21               14               28             0,44               3,08
     3        3             24                 9               27             1,44               4,32
     4        1             25                 4               16             2,44               2,44
             25                              39                83                               19,68



               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Parámetros de dispersión

Rango = 4-0 = 4
                                                            _

                                           ∑x       i   −x ⋅ f i
                                                                        19,68
Desviación media               Dm =         i
                                                                       =      =0,79
                                                        N                25



                   ∑x
                               2
                           i       ⋅ fi    _2
                                                   83
Varianza s =
           2         i
                                          −x =        −1,56 2 = 0,89
                          N                        25




Desviación típica s = s 2 = 0,89 = 0,94


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Parámetros de dispersión

 Exemplo 2 (variable continua)
 Retomamos o exemplo da estación meterolóxica e completamos a táboa.
     Litros/   Marca            fi            xi⋅fi              xi2⋅fi             xi − x         xi − x ⋅ f i
       m2      s (xi)
      [0,5)     2,5             3              7,5              18,75               16,02             48,06
     [5,10)     7,5             7             52,5             393,75               11,02             77,14
     [10,15)   12,5            19            237,5            2968,75                6,02            114,38
     [15,20)   17,5            23            402,5            7043,75                1,02             23,46
     [20,25)   22,5            18             405             9112,50                3,98             71,64
     [25,30)   27,5            12             330             9075,00                8,98            107,76
     [30,35)   32,5             6             195             6337,50               13,98             83,88
                             N=88            1630              34950                                 526,32


                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Parámetros de dispersión


                                                                  _

                                                   ∑ x −x⋅ f
Desviación media
                                                          i           i
                                                                              526,32
                                          Dm =      i
                                                                          =          = 5,98
                                                              N                 88




                    ∑ xi ⋅ f i
                            2
                                       _2

Varianza
                                              34950
            s2 =      i
                                   −x =             − 18,52 2 = 54,17
                          N                    88



Desviación típica                      s = s 2 = 54,17 = 3,75


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Utilización conxunta de media e desviación típica.




 En distribucións cunha soa moda e bastante simétricas
 verifícase:

 1. No intervalo             ( x − s, x + s ) atópase o 68% dos datos.

 2. No intervalo ( x − 2s, x + 2s ) atópase o 95% dos datos.

 3. No intervalo ( x − 3s, x + 3s )                  atópase o 99% dos datos.




                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Utilización conxunta da media e a desviación
típica.

Exemplo
Comparación media e desviación típica:
coa mesma media, cal interesa ou é máis
rendible?

                            Ver Exemplo



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Medidas de posición non central:


 As medidas de posición non central permiten coñecer outros
 puntos característicos da distribución que non son os valores
 centrais. Entre as medidas de posición non central máis
 importantes están os cuantís que son aqueles valores da variable,
 que ordenados de menor a maior, dividen a distribución en partes,
 de tal xeito que cada unha delas contén o mesmo número de
 frecuencias.

   Os tipos máis importantes de cuantís son:

           – Os cuartís, que dividen a distribución en catro
             partes;
           – Os decís, que dividen a distribución en dez partes;

           – Os percentís, que dividen a distribución en cen
             partes.
               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4.- Medidas de posición non centrais: Cuartís.



 Ordenados os datos en orde crecente, os cuartís Q1,
 Q2, Q3 son os valores da variable estatística tales que a
 cuarta parte dos datos teñen valores inferiores a Q1, a
 metade dos datos teñen valores inferiores a Q2, e as
 tres cuartas partes teñen valores inferiores a Q3.
 A mediana coincide con Q2.




             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Medidas de posición. Cuartís

Cálculo dos cuartis nas variables discretas:
      Q1 calcúlase buscando o primeiro valor da
variable no que a frecuencia absoluta
acumulada supere a cuarta parte dos datos.

       Q3 calcúlase buscando o primeiro valor da
 variable no que a frecuencia absoluta
 acumulada supere as tres cuartas partes dos
 datos.

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Medidas de posición. Cuartís

   Cálculo dos cuartís nas variables continuas (ou datos
   agrupados):
   Primeiro localízanse os intervalos que conteñen os cuartís,[Li-1,Li], da
   mesma maneira que na variable discreta, e depois aplícase a fórmula:

                                      N
                                        ⋅ k − Fi −1
                         Qk = Li −1 + 4             ⋅ ei
                                           fi

  Li-1 = límite inferior da clase que contén o cuartil
  N = Nº de datos
  fi = Frecuencia absoluta da clase que contén o cuartil
  Fi-1 =frecuencia absoluta acumulada da clase anterior a que contén o
   cuartil.
  ei = lonxitude do intervalo que contén cuartil


                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4.- Medidas de posición non centrais:Deciles

 Son 9 valores da variable tales que, ordenados
 de maneira crecente, dividen a distribución
 estatística en 10 partes. Cada unha de elas
 contén a décima parte das observacións.

Represéntanse por D1, D2,…,D9.
D5 =Me




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Medidas de posición. Deciles.

Cálculo dos deciles                                   Variable continua
                                                      (ou datos agrupados):
Variable discreta:                                    Calcúlase o intervalo
Se son datos simples,                                 correspondente polo
calcúlanse as frecuencias                             procedemento anterior,
absolutas acumuladas e o decil                         [Li-1,Li], e aplícase a fórmula:
Dk será o primeiro valor da
                                                                                N
variable cuxa frecuencia                                                           ⋅ k − Fi − 1
absoluta acumulada exceda a                                       Dk = Li − 1 + 10              ⋅ ei
K.N/10 K=1,…,9.                                                                       fi

                                                                    K=1,2,…,9




              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4.- Medidas de posición non centrais: Percentís:


 Son 99 valores da variable tales que, ordenados de maneira
 crecente, dividen a distribución estatística en 100 partes. Cada
 unha delas contén a centésima parte das observacións.

 Representanse coa letra P.

 É o percentil i-ésimo, onde a i toma valores do 1 ó 99. O i% da
 mostra son valores menores ca el e o 100-i% restante son maiores.

           P50=Q2=Me

           P25=Q1

           P75=Q3




                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Medidas de posición. Percentís.

Cálculo dos percentís:
                                                       Variable continua
Variable discreta:                                     (ou datos agrupados):

                                                      Calcúlase o intervalo
Se son datos simples,                                 correspondente polo
calcúlanse as frecuencias                             procedemento anterior,
absolutas acumuladas e o                               [Li-1,Li], e aplícase a fórmula:
percentil Pk será o primeiro
valor da variable cuxa                                                         N
                                                                                  ⋅ k − Fi − 1
frecuencia absoluta acumulada                                   Pk = Li − 1 + 100              ⋅ ei
exceda a K.N/100 K=1,…,99.                                                          fi

                                                                    K=1,2,…,99




              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Medidas de posición. Cuantís.

 Exemplo variable discreta

 Táboa dunha serie de datos referidos ó talle dun grupo
 de alumnos:
                                         Ver exemplo


 Neste exemplo só veñen calculados os cuartís:
 Q1= 1,22 cm (primeiro valor cuxa frecuencia absoluta supera o 25%)
 Q2= 1,26 cm (primeiro valor cuxa frecuencia absoluta supera o 50%)
 Q3= 1,28 cm (primeiro valor cuxa frecuencia absoluta supera o 75%)



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Medidas de posición. Cuantís.


 Do mesmo modo calcúlanse os decís: D1 será o primeiro valor cuxa
 frecuencia absoluta acumulada supere o 10% dos datos, o D2 será
 o correspondente ao primeiro que supere o 20%,…
 Por exemplo:
           D1=1,22          D5=1,26      D7= 1,28

 Do mesmo xeito calculariamos os percentís: Pi será o primeiro
 valor cuxa frecuencia absoluta acumulada supere o i% dos datos,
 así, se queremos coñecer o valor do P35, observamos as frecuencias
 absolutas acumuladas, e o primeiro que supera este valor é: P35=
 1,23
 Outros:
             P71= 1,28
             P13= 1,21



               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Medidas de posición. Cuantís.

Exemplo variable continua

                                  Ver exemplo


E clica no punto 4: “Exemplos de cálculo”




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Medidas de posición. Cuantís.

Calcular cuartís gráficamente.




Nota: exemplo tomado do banco de imaxes do ITE.

                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Mais conteúdo relacionado

Mais de German Mendez (14)

Aula mentor. Oferta formativa 2012
Aula mentor. Oferta formativa 2012Aula mentor. Oferta formativa 2012
Aula mentor. Oferta formativa 2012
 
7.variablesaleatoriasdiscretas.distribuciónbinomial
7.variablesaleatoriasdiscretas.distribuciónbinomial7.variablesaleatoriasdiscretas.distribuciónbinomial
7.variablesaleatoriasdiscretas.distribuciónbinomial
 
Anexo i
Anexo iAnexo i
Anexo i
 
Anexo ii
Anexo iiAnexo ii
Anexo ii
 
11.contrastedehipóteses
11.contrastedehipóteses11.contrastedehipóteses
11.contrastedehipóteses
 
10.estimacióndeparámetros
10.estimacióndeparámetros10.estimacióndeparámetros
10.estimacióndeparámetros
 
9.mostraxe
9.mostraxe9.mostraxe
9.mostraxe
 
8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormal8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormal
 
6.probabilidadecondicionada
6.probabilidadecondicionada6.probabilidadecondicionada
6.probabilidadecondicionada
 
5.cálculodeprobabilidades
5.cálculodeprobabilidades5.cálculodeprobabilidades
5.cálculodeprobabilidades
 
4.técnicasdereconto
4.técnicasdereconto4.técnicasdereconto
4.técnicasdereconto
 
3.distribuciónsbidimensionais
3.distribuciónsbidimensionais3.distribuciónsbidimensionais
3.distribuciónsbidimensionais
 
1.iniciaciónáestatística
1.iniciaciónáestatística1.iniciaciónáestatística
1.iniciaciónáestatística
 
Indice
IndiceIndice
Indice
 

2.medidasdecentralizacióneposición

  • 1. MÉTODOS ESTATÍSTICOS E NUMÉRICOS UNIDADE 2 MEDIDAS DE CENTRALIZACIÓN E POSICIÓN ÍNDICE IES Isidro Parga Pondal. Departamento de matemáticas
  • 2. Conceptos 1. Parámetros de centralización: media, mediana e moda. 2. Parámetros de dispersión: rango, varianza, desviación típica. 3. Utilización conxunta de media e desviación típica. 4. Medidas de posición non central: cuartís, decís, percentís. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 3. 1. Parámetros de Centralización Este tipo de parámetros proporciónannos uns valores en torno ós que se centran os datos da distribución. Os principais son:  Media aritmética  Mediana  Moda IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 4. 1. Parámetros de Centralización Veremos tamén: – media aritmética ponderada – media a. Recortada – media a. truncada ou Winsorizada, – media cuadrática – media xeométrica – media harmónica. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 5. 1. Parámetros de Centralización. Tipos de media.  Media aritmética A media aritmética dunha variable estatística é o cociente entre a suma de todos os valores de dita variable e o número destes. Fórmula para datos agrupados nunha táboa estatística: _ x= ∑x ⋅ f i i N xi = valor da variable ou marca de clase fi = frecuencia absoluta N = nº de datos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 6. 1. Parámetros de Centralización. Tipos de media.  Media aritmética ponderada: Emprégase para calcular o promedio duns valores cando estes teñen diferentes ponderacións ou pesos. Se unha variable estatística toma valores x1, x2,…,xn con pesos w1, w2, …, wn respectivamente defínese a media aritmética ponderada como: n ∑ x w i i x = i =n 1 ∑w i=1 i IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 7. 1. Parámetros de Centralización. Tipos de media.  Media recortada R(p) Se temos unha serie de n datos ordenados,X1,X2,…,Xn, defínese a media recortada nunha porcentaxe p como a media aritmética deses datos onde se suprimen en ambos os extremos os correspondentes á porcentaxe p. Se suprimimos a datos por ambos extremos, teremos que a media recortada ó p% é: n −a ∑X i R ( p ) = i =1+a n − 2a IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 8. 1. Parámetros de Centralización. Tipos de media.  Media truncada ou Winsorizada W(p): Se temos unha serie de n datos ordenados,X1,X2,…,Xn, defínese a media truncada ou Winsorizada nunha porcentaxe p como a media aritmética deses datos onde se substitúen en ambos os extremos os datos correspondentes á porcentaxe p polo máis preto dese extremo. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 9. 1. Parámetros de Centralización. Tipos de media.  Media cuadrática Emprégase cando a variable toma valores positivos e negativos e non queremos que a medida de tendencia central reflicta os efectos do signo. É moi práctica cando traballamos con erros na medida dunha magnitude. Desígnase por C e a súa expresión para datos agrupados é: n ∑ i ⋅ fi 2 x C= i=1 N xi = valor da variable ou marca de clase fi = frecuencia absoluta N = nº de datos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 10. 1. Parámetros de Centralización. Tipos de media. Media Xeométrica: Utilízase cando calculamos números índices sintéticos (combinan unha grande cantidade de prezos e producións, como o IPC). Non se pode usar cando hai valores negativos. Desígnase por G, e a súa expresión para datos agrupados é: f1 f2 fn G= N x1 ⋅ x2 ⋅ ... ⋅ xn xi = valor da variable ou marca de clase fi = frecuencia absoluta N = nº de datos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 11. 1. Parámetros de Centralización. Tipos de media. Media Harmónica: É a inversa da media aritmética dos inversos dos valores da variable. É útil na comparación de velocidades promedio sobre varias distancias e na resolución de problemas estatísticos de transporte. Designase por H, e a súa fórmula para datos agrupados é: N H = n 1 ∑x f i i=1 i xi = valor da variable ou marca de clase fi = frecuencia absoluta N = nº de datos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 12. 1. Parámetros de Centralización. Tipos de media. Exemplo (media aritmética-media aritmética ponderada) Un alumno obtivo en tres exames as seguintes notas: 4-5-6. A nota media, se as tres tivesen a mesma importancia sería: _ x= ∑x ⋅ f i i = 4+5+6 =5 N 3 En cambio, se o profesor lle dá ás notas dos exames distintas ponderacións, por exemplo: 3-2-1 respectivamente, a nota media ponderada sería agora: n ∑w x i i 3 ⋅ 4 + 2 ⋅ 5 + 1⋅ 6 x= i =1 = = 4,67 n 3 + 2 +1 ∑w i =1 i IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 13. 1. Parámetros de Centralización. Tipos de media. Exemplo (media aritmética-media harmónica) e 120 AB=120km. A B velocidade media=30Km/h ⇒ t= = = 4h v 30 e 120 B A velocidade media=60Km/h ⇒ t= = = 2h v 60 Acha a velocidade media da viaxe completa: A velocidade media da viaxe sería: distancia total 240 v= = = 40km / h tempo total 6 Este promedio correspóndese coa media harmónica: N 2 H = = = 40km / h n 1 1 1 ∑x f i 30 + 60 i=1 i Se se considerara a media aritmética das velocidades, obteríamos: _ x= ∑x ⋅ f i i = 30 + 60 = 45km / h Que é incorrecto!!! N 2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 14. 1. Parámetros de Centralización. Tipos de media. Exemplo: Dada a serie estatística: 1- 4- 6- 6- 8- 8- 10- 12- 14- 30, imos achar a media recortada ao 10% e a media winsorizada ao 10%. MEDIA RECORTADA ao 10%: o 10% de 10 é 1 e eliminamos 1 dato por cada extremo. Calculamos a media aritmética dos 8 datos restantes: n−a 10 −1 ∑X i ∑X i 4 + 6 + 6 + 8 + 8 + 10 + 12 + 14 1 4 6 6 8 8 10 12 14 30 ⇒ R (10) = i =1+ a = i =1+1 = = 8,5 n − 2a 10 − 2 8 MEDIA WINSORIZADA ao 10%: substituímos os datos extremos polos datos máis próximos a eles, e calculamos a media da serie: 4 + 4 + 6 + 6 + 8 + 8 + 10 + 12 + 14 + 14 4 4 6 6 8 8 10 12 14 14 ⇒ W (10) = = 8,6 10 Obsérvase que estes valores difiren bastante da media aritmética: _ x= ∑x ⋅ f i i = 1 + 4 + 6 ⋅ 2 + 8 ⋅ 2 + 10 + 12 + 14 + 30 = 9,9 debido a que hai un valor atípico: 30 N 10 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 15. 1. Parámetros de Centralización. Media aritmética. Exemplo variable discreta Nunha poboación de 25 familias observouse a variable número de coches que ten a familia, e obtivéronse os seguintes datos: 0123101114322112211121321 Xi fi xi⋅fi 0 2 0 1 12 12 2 7 14 _ x= ∑x ⋅ f i i = 39 = 1,56 3 3 9 N 25 4 1 4 N=25 39 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 16. 1. Parámetros de Centralización. Media aritmética. Vexamos un exemplo gráfico de variable discreta obtido da páxina do ITE. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 17. 1. Parámetros de Centralización. Media aritmética. Exemplo variable continua Unha estación meteorolóxica rexistrou 88 días de choiva o pasado ano, segundo se mostra na seguinte táboa: Litros/m2 [0,5) [5,10) [10,15) [15,20) [20,25) [25,30) [30,35) Nº de días 3 7 19 23 18 12 6 Completemos a táboa: IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 18. 1. Parámetros de Centralización. Media aritmética. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 19. 1. Parámetros de Centralización. Media aritmética. Litros/m2 Marcas (xi) fi xi⋅fi [0,5) 2,5 3 7,5 [5,10) 7,5 7 52,5 [10,15) 12,5 19 237,5 [15,20) 17,5 23 402,5 [20,25) 22,5 18 405 [25,30) 27,5 12 330 [30,35) 32,5 6 195 N=88 1630 _ x= ∑x ⋅ f i i = 1630 = 18,52 litros / m 2 N 88 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 20. 1.-Parámetros de centralización: Mediana. A mediana Me dunha variable estatística é o valor de dita variable tal que o número de valores menores ca el é igual ó número de valores maiores ca el. Ou dito doutro xeito, é o valor tal que, ordenados os valores en orde crecente ou decrecente ocupa a posición central. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 21. 1. Parámetros de Centralización. Mediana. • Cálculo da mediana nas variables discretas: • Se N é impar e os datos son simples a Mediana é o valor que ocupa o lugar (N+1)/2. Exemplo: 1,4,6,7,8,10,13,16,20, 24,25,27,30 N=13 ocupa a posición central ⇒ Me=13 • Se N é par e os datos son simples hai dous valores centrais e a mediana será a media aritmética dos valores que ocupan os postos N/2 e N/2 + 1. Exemplo: 1,4,6,7,8,10,13,16,20,24,25,27 N=12  ocupan as posicións centrais 10 + 13 Me = = 11,5 2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 22. 1. Parámetros de Centralización. Mediana. • Cálculo da mediana nas variables discretas: Se os datos están tabulados nunha táboa de frecuencias, a mediana é o primeiro valor da variable estatística no que a frecuencia absoluta acumulada supere a metade dos datos. Se a metade dos datos coincide con algunha frecuencia absoluta acumulada , a mediana sería a media aritmética dese valor e o seguinte na táboa. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 23. 1. Parámetros de Centralización. Mediana • Cálculo da mediana nas variables continuas (ou para datos agrupados): Intervalo mediano ou clase mediana [Li-1,Li]: O primeiro no que a frecuencia absoluta acumulada supere a metade dos datos N Mediana: − Fi −1 Me = Li − 1 + 2 ⋅ ei fi Li-1=límite inferior da clase mediana Fi-1=frecuencia absoluta acumulada da clase anterior a mediana. fi=frecuencia absoluta da clase mediana N=nº de datos ei=lonxitude das clases ou intervalos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 24. 1. Parámetros de Centralización. Mediana. Exemplo variable discreta xi fi Fi Voltamos ao exemplo de nº de coches por 0 2 2 familia: 1 12 14 -Completamos a táboa calculando as Fi 2 7 21 N=25 impar ⇒ (N+1)/2 = 26/2= 13 3 3 24 - Observamos cal é a primeira frecuencia absoluta acumulada que supera este valor 4 1 25 e correspóndese co xi = 1. 25 25 Por tanto, mediana=1 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 25. 1. Parámetros de Centralización. Mediana. Exemplo variable continua Litros/m Marca fi Fi Voltando ao exemplo da 2 s (xi) estación meterolóxica: [0,5) 2,5 3 3 [5,10) 7,5 7 10 O intervalo mediano é [15,20) [10,15) 12,5 19 29 A mediana calcúlase: Li-1=15 [15,20) 17,5 23 52 Fi-1=29 [20,25) 22,5 18 70 fi=23 [25,30) 27,5 12 82 ei=5 [30,35) 32,5 6 88 N 88 N=88 − Fi −1 − 29 Me = Li − 1 + 2 ⋅ ei = 15 + 2 ⋅ 5 = 18,26 litros / m 2 fi 23 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 26. 1.-Parámetros de centralización. Moda A moda dunha variable estatística, Mo , é o valor (ou valores) de dita variable que ten maior frecuencia absoluta. • Cálculo da moda nas variables discretas: O valor , ou valores, da variable estatística no que a frecuencia absoluta sexa maior. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 27. 1. Parámetros de Centralización. Moda • Cálculo da moda nas Variables continuas (ou para datos agrupados): – Intervalo modal ou clase modal [Li-1,Li]: O intervalo no que a frecuencia absoluta sexa maior. – Moda: f i − f i −1 D1 M o = Li −1 + ⋅ ei = Li − 1 + ⋅ ei 2 ⋅ f i − f i −1 − f i + 1 D1 + D 2  Li-1=límite inferior da clase modal  fi,fi-1,fi+1=frecuencia absoluta da clase modal,anterior e posterior  D1 =fi -fi-1 D2 = fi –fi+1  ei=lonxitude das clases ou intervalos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 28. 1. Parámetros de Centralización. Moda. Exemplo 1 (variable discreta): xi fi Fi Voltamos ao exemplo de nº de coches por 0 2 2 familia: 1 12 14 O valor da variable estatística no que a 2 7 21 frecuencia absoluta é maior correspóndese co xi = 1. 3 3 24 4 1 25 Por tanto, moda=1 25 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 29. 1. Parámetros de Centralización. Moda. Exemplo 2 (variable continua): Litros/m2 Marcas fi (xi) Voltando ao exemplo da estación [0,5) 2,5 3 meterolóxica: [5,10) 7,5 7 [10,15) 12,5 19 O intervalo modal é [15,20) A mediana calcúlase: [15,20) 17,5 23 Li-1=15 [20,25) 22,5 18 D1=fi-fi-1=23-19=4 [25,30) 27,5 12 D2=fi-fi+1=23-18=5 [30,35) 32,5 6 ei=5 N=88 f i − f i −1 D1 4 M o = Li −1 + ⋅ ei = Li − 1 + ⋅ ei = 15 + ⋅ 5 = 17,2 litros / m 2 2 ⋅ f i − f i −1 − f i +1 D1 + D 2 4+5 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 30. 2. Parámetros de dispersión: A parte das medidas de centralización, é necesario coñecer en que medida os datos numéricos están ou non agrupados ó redor dos valores centrais. A isto é o que chaman dispersión e os parámetros que miden estas desviacións respecto da media chámanse parámetros de dispersión. Os máis importantes son: • Rango • Desviación media • Varianza • Desviación Típica IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 31. 2. Parámetros de dispersión Rango O percorrido ou rango dunha distribución é a diferenza entre o maior e o menor valor da variable estatística. Desviación media A desviación media dunha variable estatística é a media aritmética dos valores absolutos das desviacións respecto á media. _ ∑ x −x⋅ f i i Dm = i N xi= Valor da variable ou marca de clase fi=Frecuencia absoluta _ N=Nº de datos x = Media aritmética IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 32. 2. Parámetros de dispersión Varianza A varianza dunha variable estatística é a media aritmética dos cadrados das desviacións respecto á media. 2   _ ∑  xi − x  ⋅ f i  ∑ xi ⋅ f i 2 _2 s2 = i = i −x N N xi= Valor da variable ou marca de clase fi=Frecuencia absoluta _ N=Nº de datos x = Media aritmética Desviación Típica A desviación típica é a raíz cadrada positiva da varianza. s = s2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 33. 2. Parámetros de dispersión Exemplo 1 v. discreta Voltamos ao exemplo de nº de coches por familia e completamos a táboa: xi fi Fi xifi xi2 fi xi − x xi − x ⋅ f i 0 2 2 0 0 1,56 3,12 1 12 14 12 12 0,56 6,72 2 7 21 14 28 0,44 3,08 3 3 24 9 27 1,44 4,32 4 1 25 4 16 2,44 2,44 25 39 83 19,68 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 34. 2. Parámetros de dispersión Rango = 4-0 = 4 _ ∑x i −x ⋅ f i 19,68 Desviación media Dm = i = =0,79 N 25 ∑x 2 i ⋅ fi _2 83 Varianza s = 2 i −x = −1,56 2 = 0,89 N 25 Desviación típica s = s 2 = 0,89 = 0,94 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 35. 2. Parámetros de dispersión Exemplo 2 (variable continua) Retomamos o exemplo da estación meterolóxica e completamos a táboa. Litros/ Marca fi xi⋅fi xi2⋅fi xi − x xi − x ⋅ f i m2 s (xi) [0,5) 2,5 3 7,5 18,75 16,02 48,06 [5,10) 7,5 7 52,5 393,75 11,02 77,14 [10,15) 12,5 19 237,5 2968,75 6,02 114,38 [15,20) 17,5 23 402,5 7043,75 1,02 23,46 [20,25) 22,5 18 405 9112,50 3,98 71,64 [25,30) 27,5 12 330 9075,00 8,98 107,76 [30,35) 32,5 6 195 6337,50 13,98 83,88 N=88 1630 34950 526,32 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 36. 2. Parámetros de dispersión _ ∑ x −x⋅ f Desviación media i i 526,32 Dm = i = = 5,98 N 88 ∑ xi ⋅ f i 2 _2 Varianza 34950 s2 = i −x = − 18,52 2 = 54,17 N 88 Desviación típica s = s 2 = 54,17 = 3,75 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 37. 3. Utilización conxunta de media e desviación típica. En distribucións cunha soa moda e bastante simétricas verifícase: 1. No intervalo ( x − s, x + s ) atópase o 68% dos datos. 2. No intervalo ( x − 2s, x + 2s ) atópase o 95% dos datos. 3. No intervalo ( x − 3s, x + 3s ) atópase o 99% dos datos. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 38. 3. Utilización conxunta da media e a desviación típica. Exemplo Comparación media e desviación típica: coa mesma media, cal interesa ou é máis rendible? Ver Exemplo IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 39. 4. Medidas de posición non central: As medidas de posición non central permiten coñecer outros puntos característicos da distribución que non son os valores centrais. Entre as medidas de posición non central máis importantes están os cuantís que son aqueles valores da variable, que ordenados de menor a maior, dividen a distribución en partes, de tal xeito que cada unha delas contén o mesmo número de frecuencias. Os tipos máis importantes de cuantís son: – Os cuartís, que dividen a distribución en catro partes; – Os decís, que dividen a distribución en dez partes; – Os percentís, que dividen a distribución en cen partes. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 40. 4.- Medidas de posición non centrais: Cuartís. Ordenados os datos en orde crecente, os cuartís Q1, Q2, Q3 son os valores da variable estatística tales que a cuarta parte dos datos teñen valores inferiores a Q1, a metade dos datos teñen valores inferiores a Q2, e as tres cuartas partes teñen valores inferiores a Q3. A mediana coincide con Q2. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 41. 4. Medidas de posición. Cuartís Cálculo dos cuartis nas variables discretas: Q1 calcúlase buscando o primeiro valor da variable no que a frecuencia absoluta acumulada supere a cuarta parte dos datos. Q3 calcúlase buscando o primeiro valor da variable no que a frecuencia absoluta acumulada supere as tres cuartas partes dos datos. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 42. 4. Medidas de posición. Cuartís Cálculo dos cuartís nas variables continuas (ou datos agrupados): Primeiro localízanse os intervalos que conteñen os cuartís,[Li-1,Li], da mesma maneira que na variable discreta, e depois aplícase a fórmula: N ⋅ k − Fi −1 Qk = Li −1 + 4 ⋅ ei fi Li-1 = límite inferior da clase que contén o cuartil N = Nº de datos fi = Frecuencia absoluta da clase que contén o cuartil Fi-1 =frecuencia absoluta acumulada da clase anterior a que contén o cuartil. ei = lonxitude do intervalo que contén cuartil IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 43. 4.- Medidas de posición non centrais:Deciles Son 9 valores da variable tales que, ordenados de maneira crecente, dividen a distribución estatística en 10 partes. Cada unha de elas contén a décima parte das observacións. Represéntanse por D1, D2,…,D9. D5 =Me IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 44. 4. Medidas de posición. Deciles. Cálculo dos deciles Variable continua (ou datos agrupados): Variable discreta: Calcúlase o intervalo Se son datos simples, correspondente polo calcúlanse as frecuencias procedemento anterior, absolutas acumuladas e o decil [Li-1,Li], e aplícase a fórmula: Dk será o primeiro valor da N variable cuxa frecuencia ⋅ k − Fi − 1 absoluta acumulada exceda a Dk = Li − 1 + 10 ⋅ ei K.N/10 K=1,…,9. fi K=1,2,…,9 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 45. 4.- Medidas de posición non centrais: Percentís: Son 99 valores da variable tales que, ordenados de maneira crecente, dividen a distribución estatística en 100 partes. Cada unha delas contén a centésima parte das observacións. Representanse coa letra P. É o percentil i-ésimo, onde a i toma valores do 1 ó 99. O i% da mostra son valores menores ca el e o 100-i% restante son maiores. P50=Q2=Me P25=Q1 P75=Q3 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 46. 4. Medidas de posición. Percentís. Cálculo dos percentís: Variable continua Variable discreta: (ou datos agrupados): Calcúlase o intervalo Se son datos simples, correspondente polo calcúlanse as frecuencias procedemento anterior, absolutas acumuladas e o [Li-1,Li], e aplícase a fórmula: percentil Pk será o primeiro valor da variable cuxa N ⋅ k − Fi − 1 frecuencia absoluta acumulada Pk = Li − 1 + 100 ⋅ ei exceda a K.N/100 K=1,…,99. fi K=1,2,…,99 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 47. 4. Medidas de posición. Cuantís. Exemplo variable discreta Táboa dunha serie de datos referidos ó talle dun grupo de alumnos: Ver exemplo Neste exemplo só veñen calculados os cuartís: Q1= 1,22 cm (primeiro valor cuxa frecuencia absoluta supera o 25%) Q2= 1,26 cm (primeiro valor cuxa frecuencia absoluta supera o 50%) Q3= 1,28 cm (primeiro valor cuxa frecuencia absoluta supera o 75%) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 48. 4. Medidas de posición. Cuantís. Do mesmo modo calcúlanse os decís: D1 será o primeiro valor cuxa frecuencia absoluta acumulada supere o 10% dos datos, o D2 será o correspondente ao primeiro que supere o 20%,… Por exemplo: D1=1,22 D5=1,26 D7= 1,28 Do mesmo xeito calculariamos os percentís: Pi será o primeiro valor cuxa frecuencia absoluta acumulada supere o i% dos datos, así, se queremos coñecer o valor do P35, observamos as frecuencias absolutas acumuladas, e o primeiro que supera este valor é: P35= 1,23 Outros: P71= 1,28 P13= 1,21 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 49. 4. Medidas de posición. Cuantís. Exemplo variable continua Ver exemplo E clica no punto 4: “Exemplos de cálculo” IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 50. 4. Medidas de posición. Cuantís. Calcular cuartís gráficamente. Nota: exemplo tomado do banco de imaxes do ITE. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Notas do Editor

  1. Falta por aclarar el ejemplo 1. El gráfico es de muy baja resolución. Será mejor buscar otro?