2. Dispersión
• La dispersión muestra la disparidad que
existe entre los valores de la variable. Si es
elevada, las medidas de posición pueden
resultar poco representativas, al ser una
muestra poco homogénea para esa variable.
Si la dispersión es baja, la representatividad
de las medidas de posición mejora, siendo
el grupo más homogéneo.
3. Medidas de dispersión
• Las medidas de tendencia central son valores en
una distribución y las medidas de la variabilidad
son intervalos, designan distancias o un número de
unidades en la escala de medición.
• Sólo pueden obtenerse con variables de escala de
intervalo o de razón en las que puede valorarse el
grado de representatividad de medidas de posición
como la media.
4. Medidas de dispersión
ABSOLUTAS
Pueden ser
Recorrido
Desviación media
Varianza
Desviación estándar
RELATIVAS
Coeficiente de apertura
Recorrido relativo
Coeficiente de variación
6. Recorrido
• Es la diferencia entre el mayor y el menor valor de
la variable:
R = x Max − x min
7. Recorrido
VENTAJAS
• Cálculo sencillo
DESVENTAJAS
• Sólo tiene en cuenta dos
valores de la serie.
• Le afecta la existencia de
valores extremos.
• No se refiere a ninguna
medida de posición central
por lo que no sirve para
valorar representatividad
de alguna de ellas.
8. Desviación media
n
De una población:
DM =
∑
i =1
n
DESVIACION MEDIA
n
De una muestra:
DM =
Xi − µ
∑
i =1
Xi − X
n
8
9. Desviación media
• Si no se tomaran los valores absolutos de las
diferencias entre los valores de la variable y
la media el resultado sería igual a 0.
• La DM puede calcularse respecto a la
mediana y a la moda, en el caso de que la
media no sea representativa de los valores
que toma la variable.
10. CALCULO DE LA DESVIACION MEDIA
Caso de una Distribución de Frecuencia de Datos No Agrupados:
Ejemplo:
Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de
su consulta en el momento de empezar a caminar:
11. CALCULO DE LA DESVIACION MEDIA
µ = 12,2 meses
n = 50
Meses
(x)
Niños (f)
lxi-µl
lxi-µl fi
9
1
3,2
3,2
10
4
2,2
8,8
11
9
1,2
10,8
12
16
0,2
3,2
13
11
0,8
8,8
14
8
1,8
14,4
15
1
2,8
2,8
50
52
n
DM =
DM =
∑
i =1
Xi − µ
n
52
= 1,04meses
50
12. CALCULO DE LA DESVIACION MEDIA
Caso de una Distribución de Frecuencia de Datos Agrupados:
Ejemplo:
Las alturas de los jugadores de un equipo de basquet vienen dadas por la
tabla:
13. CALCULO DE LA DESVIACION MEDIA
µ = 186,63 cm
n = 23
Altura
(cms)
Nº de
jugado
res
MC
lMCi-µl
lMCi-µl fi
[170, 175)
1
172,5
14,13
14,13
[175, 180)
3
177,5
9,13
27,39
[180, 185)
4
182,5
4,13
16,52
[185, 190)
8
187,5
0,87
6,96
[190, 195)
5
192,5
5,87
29,35
[195, 200)
2
197,5
10,87
21,74
23
116,09
n
DM =
∑
i =1
Xi − µ
n
116,09
DM =
= 5.05cm
23
14. Varianza
Es una medida de dispersión que cuantifica la variabilidad de los
datos con respecto a la media aritmética y se denota por V(X).
Se define como la media aritmética de las desviaciones al
cuadrado de cada uno de los datos con respecto a la media.
n
Para una población:
σ 2 (x) =
∑ (x
i =1
s 2 (x) =
− µ)
=
n
n
Para una muestra:
i
∑
i =1
(xi − x)
n
n
2
∑
i =1
=
2
n
n
2
x i2 − n µ
∑
i =1
x i2 − n x
n
Cuando se refiere a la población se representa por σ2 y si se refiere a la
muestra se representa como s2
2
15. CALCULO DE LA VARIANZA
Meses
(x)
Niños (f)
(xi-µ)2
(xi-µ)2 fi
9
1
10,24
10,24
10
4
4,84
19,36
11
9
1,44
12,96
12
16
0,04
0,64
13
11
0,64
7,04
14
8
3,24
25,92
15
1
7,84
7,84
50
84
µ = 12,2 meses
n = 50
n
σ 2 ( x) =
∑ (x
i =1
i
− µ)2
n
=
84
= 1,68meses 2
50
16. CALCULO DE LA VARIANZA
Meses
(x)
Niños (f)
x i2
x i2 f i
9
1
81
81
10
4
100
400
11
9
121
1089
12
16
144
2304
13
11
169
1859
14
8
196
1568
15
1
225
225
50
7526
µ = 12,2 meses
n = 50
n
σ ( x) =
2
∑x
i =1
2
i
− nµ 2
n
7526 − 50 ⊗ 12,2 2
=
= 1,68
50
17. Propiedades de la Varianza
1. Nunca es negativa: el numerador incluye
diferencias al cuadrado.
2. Si se suma una constante k (positiva o negativa)
a todos los valores de la variable, la varianza no
cambia.
3. Si se multiplica por una constante k a todos los
valores de la variable, la varianza queda
multiplicada por k2. Si se divide por k la
varianza queda dividida por k2.
18. Varianza
• Es un concepto estadístico sumamente
importante porque muchas de las pruebas
cuantitativas se fundamentan en él.
• En general, es difícil interpretar puesto que
su magnitud se expresa en valores al
cuadrado. Para fines descriptivos se utiliza
preferentemente la desviación estándar.
19. Desviacion Standard
Se define como la raíz cuadrada de la varianza
n
Para una población: σ ( x ) =
∑
i =1
n
n
Para una muestra:
s(x) =
(xi − µ )
∑
i =1
(xi − x)
n
n
2
=
∑
i =1
=
2
n
n
2
x i2 − n µ
∑
i =1
x i2 − n x
2
n
Cuando se refiere a la población se representa por σ y si se refiere a la
muestra se representa como s
20. CALCULO DE LA DESVIACIÓN ESTÁNDAR
Meses
(x)
σ ( x) =
i =1
n
10,24
4
4,84
19,36
11
9
1,44
12,96
12
16
0,04
0,64
11
0,64
7,04
8
3,24
25,92
15
− µ)
10,24
14
i
1
13
∑ (x
(xi-µ)2 fi
10
n
(xi-µ)2
9
µ = 12,2 meses
n = 50
Niños (f)
1
7,84
7,84
50
2
=
84
= 1,68meses 2 = 1,30meses
50
84
21. CALCULO DE LA DESVIACIÓN ESTÁNDAR
Meses
(x)
σ ( x) =
i =1
n
81
4
100
400
11
9
121
1089
12
16
144
2304
11
169
1859
8
196
1568
15
− nµ
81
14
∑x
1
13
2
i
x i2 f i
10
n
x i2
9
µ = 12,2 meses
n = 50
Niños (f)
1
225
225
50
2
=
7526 − 50 ⊗ 12,2 2
= 1,68mes 2 = 1,30mes
50
7526
22. Propiedades de la Desviación
estándar
1. Nunca es negativa, dado que se toma la raíz
positiva.
2. Si se suma una constante k (positiva o negativa)
a todos los valores de la variable, la desviación
estándar no cambia.
3. Si se multiplica por una constante k a todos los
valores de la variable, la desviación estándar
queda multiplicada por k. Si se divide por k la
desviación estándar queda dividida por k.
23. Desviación estándar
• Su ventaja frente a la varianza es que sus
unidades son las mismas que la variable.
Luego, puede ser comparada directamente
con la media para determinar su
representatividad.
• Se emplea con varios métodos de inferencia
estadística.
25. Coeficiente de Apertura
Es el cociente entre el mayor y el menor valor de la
variable. A mayor CA, mayor dispersión.
x Max
CA =
x min
Es sencillo de calcular pero le afecta la existencia de valores
extremadamente grandes y/o pequeños y no se refiere a
ninguna medida de posición central.
26. Recorrido relativo
Es el cociente entre el recorrido y la media. Es el
número de veces que el recorrido incluye a la
media. A mayor recorrido relativo, mayor
dispersión.
Rr =
x Max − x min
X
Es sencillo de calcular y tiene en cuenta una medida de
posición central, pero le afecta la existencia de valores
extremos.
27. Coeficiente de variación
Es el cociente entre la desviación estándar y la media.
Es el número de veces que la desviación estándar
incluye a la media. A mayor coeficiente de
variación, mayor dispersión.
s
CV =
X
Expresa si la dispersión es alta o no y el grado de
representatividad de la media. Además permite comparar
coeficientes de distintas series de datos y sus respectivos
niveles de dispersión.
28. Cálculo del Coeficiente de variación
Se va a comparar la dispersión en precios anuales
de las acciones que se venden a menos de $20 y
la dispersion en los precios de aquellas que se
venden por arriba de $100. El precio medio de las
acciones que se venden a menos de $20 es de
$5.25 y la desviación estandar es de $1.52 y el
precio medio de las acciones que se negocian a
mas de $100 es de $92.50 y su desviación
estandar es de $5.28
28
30. Valores del Coeficiente de variación
• Si la media es negativa, se toma su valor absoluto.
• No es posible calcularlo si la media es cero.
• Si la desviación estándar es igual a cero, no hay dispersión:
todos los valores son iguales ⇒ CV = 0
• Si 0 ≤ CV ≤ 0,3 existe poca dispersión. La media es
representativa.
• Si 0,3 ≤ CV 〈1 la dispersión será baja si CV es cercano a
0,3 y alta si es cercano a 1. La media será bastante o poco
representativa, dependiendo del valor de CV.
• Si CV ≥ 1 existe mucha dispersión. La media no es
representativa.
31. ASIMETRÍA
En distribuciones totalmente simétricas, la media, la mediana y la moda
coinciden, localizándose en un mismo valor. En cambio, en distribuciones
moderadamente asimétricas, la siguiente relación se mantiene
aproximadamente:
Media – Moda = 3(Media – Mediana)
Asimetría hacia la
izquierda o negativa
Simetría
Asimetría hacia la
derecha o positiva
32. Coeficiente de Asimetría de Pearson
• Mide la desviación respecto de la simetría
expresando la diferencia entre la media y la
mediana en relación con la desviación estándar
del grupo:
3( µ − Me)
P=
σ
• Si la asimetría es moderada: P ≈ µ − Mo
σ
Si P=0, distribución simétrica
Si P>0, asimetría positiva
Si P<0, asimetría negativa
33. Puntuación “Z”
Las puntuaciones “Z” son transformaciones que se pueden
hacer a los valores obtenidos, con el propósito de analizar
su distancia respecto a la media, en unidades de desviación
estándar.
Z=
•
•
x−µ
σ
Una puntuación “Z” nos indica la dirección y grado en que una
observación se aleja de la media, en una escala de unidades de
desviación estándar.
El estandarizar valores permite comparar puntuaciones de dos
distribuciones. La variable debe estar medida en una escala de
intervalos o de razón.
34. Ejemplo
• La media de una distribución de frecuencias es
60 y la desviación estándar de 10. Se desea
comparar la observación de valor 50 con el resto
de la distribución:
µ= 60
σ = 10
x = 50
}
⇒
Z=
x−µ
σ
=
50 − 60
= −1
10
Podemos decir que el valor “50” está localizado a una
desviación estándar por debajo de la media de la distribución.