Medidas de dispersión: Concepto. Características y usos.
Rango
Desviaciones típicas.
Varianza
Coeficiente de variación.
Concepto. Características y utilidad
1. Republica Bolivariana de Venezuela
Ministerio del Popular para la Educación Superior
Instituto Universitario Politécnico “Santiago Mariño”
Profesor: Bachiller:
Pedro Beltrán Elena Vargas
Sección CV 26.756.592
Barcelona, Julio de 2016
2. Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los
valores de la variable a un cierto valor central, o que permiten identificar la
concentración de los datos en un cierto sector del recorrido de la variable. Se trata
de coeficiente para variables cuantitativas.
Son medidas de la variabilidad de un conjunto de datos y nos miden la dispersión
del conjunto con respecto a alguna medida del centro. Las medidas de dispersión
más conocidas son: La varianza, la desviación estándar, el rango, el rango
cuartílico y el rango percentil.
Características y Utilidad
Las medidas de dispersión nos sirven para cuantificar la separación de los valores
de una distribución.
Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o menor separación de
los valores de la muestra, respecto de las medidas de centralización que hayamos
calculado.
Al calcular una medida de centralización como es la media aritmética, resulta
necesario acompañarla de otra medida que indique el grado de dispersión, del
resto de valores de la distribución, respecto de esta media.
3. Es la medida de dispersión más sencilla de calcular. Es la diferencia entre el mayor
y el menor valor que toma la variable. Es una medida poco precisa ya que sólo
toma en consideración un par de observaciones y puede verse afectada por
valores extremos.
Por ejemplo: Hallar el rango de los datos 2, 9, 8, 9, 15, 21, 5, 20.
El Rango quedaría 21-2=19.
Características y Utilidad
Es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte unidades
con los datos. Permite obtener una idea de la dispersión de los datos, cuanto
mayor es el rango, más dispersos están los datos de un conjunto.
4. Se denota por 2 S. La varianza es la mediada de dispersión más importante,
principalmente porque cumple muchas propiedades que la hacen ser preferida
entre otras medidas de dispersión
a) Para datos no agrupados:
b) Para datos agrupados:
Donde
ni : frecuencia absoluta de la clase i -ésima.
M i : marca de la clase i -ésima.
k : número de clases o intervalos.
n : tamaño de la muestra.
5. Propiedades de la varianza :
1) Es siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0
solamente cuando
2) La varianza es la medida de dispersión cuadrática optima por ser la menor de
todas.
3) Si a todos los valores de la variable se le suma una constante la varianza no se
modifica. Veámoslo:
Si a xi le sumamos una constante xi’ = xi + k tendremos (sabiendo que )
Si todos los valores de la variable se multiplican por una constante la varianza
queda multiplicada por el cuadrado de dicha constante. Veámoslo:
Si a xi’ = xi • k tendremos (sabiendo que )
6. 4) Si en una distribución obtenemos una serie de subconjuntos disjuntos, la
varianza de la distribución inicial se relaciona con la varianza de cada uno de los
subconjuntos mediante la expresión
Siendo
Ni el nº de elementos del subconjunto (i)
S2i la varianza del subconjunto (i)
7. La desviación estándar o desviación típica (σ) es una medida de centralización o
dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad
en la estadística descriptiva.
Es la raíz cuadrada de la varianza representando se con la letra S y se define
como la raíz de la sumatoria (S) de las desviaciones cuadradas entre el número
total de datos de la muestra menos uno. Tiene las mismas unidades que los datos
de la muestra estadística
Característica y Utilidad
Una de las características es que es menos sensible que el rango a valores
extremos, pero más sensible que el rango intercuartílico. Es afectada por el valor
de cada observación Como consecuencia de considerar desviaciones cuadráticas
pone mayor énfasis en las desviaciones extremas que en las demás. Una
desviación estándar se forma un intervalo en el cual se encuentra el 68.27% de los
valores centrales de la variable.
8. Propiedades de la desviación típica
A su vez la desviación típica, también tiene una serie de propiedades que se
deducen fácilmente de las de la varianza (ya que la desviación típica es la raíz
cuadrada de la varianza):
1) La desviación típica es siempre un valor no negativo S será siempre 0 por
definición. Cuando S = 0 X = xi (para todo i).
2) Es la medida de dispersión óptima por ser la más pequeña.
3) Si a todos los valores de la variable se le suma una misma constante la
desviación típica no varía.
4)Si a todos los valores de la variable se multiplican por una misma constante, la
desviación típica queda multiplicada por el valor absoluto de dicha constante.
9. El gerente de una empresa de alimentos desea saber que tanto varían los pesos
de los empaques (en gramos), de uno de sus productos; por lo que opta por
seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los
siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:
La varianza sería:
Por lo tanto la desviación estándar sería:
10. En estadística, cuando se ansiasta hacer referencia a la relación entre el tamaño
de la media también la variabilidad de la variable, se usa el coeficiente de
variación. Su enuncia declara la desviación estándar como porcentaje de la centra
aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad
que la desviación típica o estándar.
Finalmente se puede definir el coeficiente de variación muestral, que nos da un
índice de la proporción que representa la desviación estándar con respecto a la
media. Se denota por CV .
Características y Utilidad
Puesto que tanto la desviación estándar como la media se miden en las unidades
originales, el CV es una medida independiente de las unidades de medición.
Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar
la variabilidad de dos conjuntos de datos. En áreas de investigación donde se
tienen datos de experimentos previos, el CV es muy usado para evaluar la
precisión de un experimento, comparando en CV del experimento en cuestión con
los valores del mismo en experiencias anteriores. Este coeficiente es muy útil,
cuando se trata de compara poblaciones cuyas variables en estudio tiene
diferentes unidades.
11. En seis sábados consecutivos un operador de taxis recibió 9, 7, 11, 10, 13 y 7
llamadas a su sitio para su servicio. Calcule:
a) Rango
Valor máximo 13;
Valor mínimo 7
R= 13 - 7 = 6
b) Desviación típica o estándar.
c) Varianza.
d) Coeficiente de variación.
9 -0.5 0.25
7 -2.5 6.25
11 1.5 2.25
10 0.5 0.25
13 3.5 12.25
7 -2.5 6.25
0.0 27.50