Este documento explica varias medidas de dispersión estadísticas, incluyendo el rango, desviación estándar, y varianza. Define cada medida y proporciona fórmulas para calcularlas. También discute las propiedades de estas medidas y cómo se usan para describir cuán dispersos están los valores de una variable en una distribución de datos.
2. La Dispersión permite analizar cómo se dispersan los valores de una
variable de tipo intervalo/razón de menor a mayor y la forma gráfica que estos
valores presentan. Si se conoce la media e una población hay distintas posibles
formas de distribuir los valores, e posible que todos estén alrededor de la media o
podrán estar sesgados hacia un lado. Estudiar la dispersión es revisar el eje
horizontal y observar donde están alojados los datos.
Entonces los Estadísticos de Dispersión o Medidas de Dispersión describen como
se dispersan los datos de una variable a lo largo de su distribución. Las Medidas de
Dispersión son: el Rango, la Desviación Estándar y la Varianza.
Características de las medidas de dispersión.
Las medidas de dispersión nos sirven para cuantificar la separación de
los valores de una distribución.
Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o menor separación de
los valores de la muestra, respecto de las medidas de centralización que hayamos
calculado.
Al calcular una medida de centralización como es la media aritmética,
resulta necesario acompañarla de otra medida que indique el grado de dispersión,
del resto de valores de la distribución, respecto de esta media.
A estas cantidades o coeficientes, les llamamos: MEDIDAS DE DISPERSIÓN,
pudiendo ser absolutas o relativas.
Medidas de Dispersión .
3. El Rango
Es una Medida de Dispersión que indica cómo los datos de una variable
se distribuyen de menor a mayor, es decir la distancia entre el valor mínimo y
máximo, es fácil de calcular porque solo deberá restar el valor máximo menos el valor
mínimo. El Rango se ve afectado cuando exista valores muy aislados del grupo, la
información que suministra no dice nada de la distribución de puntuaciones
Ejemplo:
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y
el dato de mayor valor Max= 8. El medio rango resolviéndolo mediante la
correspondiente fórmula sería:
Medio Rango = frac{ (8 + 3)}{2} = 5.5
Hay 2 maneras de expresar ésta medida:
1) La diferencia entre los valores mayor y menor
2) Los valores mayor y menor del grupo.
4. Datos agrupados
Hay dos formas para determinar el rango para datos agrupados:
1) Rango = punto medio de la clase más alta – punto medio de la más baja
2) Rango = límite superior de la clase más alta – límite inferior de la más baja.
Ventajas
• Es relativamente sencilla su obtención
• El significado de ésta medida es fácil de comprender
Limitaciones
• Considera sólo los valores extremos de un conjunto, y no proporciona mayor
información respecto a los demás valores del mismo
• Tiene una limitada utilidad para los distintos tipos de análisis
Desviación típica
La varianza a veces no se interpreta claramente, ya que se mide en unidades
cuadráticas. Para evitar ese problema se define otra medida de dispersión, que es la
desviación típica, o desviación estándar, que se halla como la raíz cuadrada positiva de
la varianza. La desviación típica informa sobre la dispersión de los datos respecto al
valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta
medida viene representada en la mayoría de los casos por S, dado que es su inicial de su
nominación en inglés.
.
5. Desviación típica muestral
S = sqrt{frac{sum_{i=1}^n (x_i - bar{x})^2}{n-1}}
Desviación típica poblacional
sigma = sqrt{frac{sum_{i=1}^n fi (X_i - mu)^2}{n}}
-->x = [17 14 2 5 8 7 6 8 5 4 3 15 9]
x = 17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9.
-->stdev(x)
ans = 4.716311
-->
Primero hemos declarado un vector con nombre X, donde introducimos los números
de la serie. Luego con el comando stdev se hallará la desviación típica.
Varianza
Es una medida estadística que mide la dispersión de los valores respecto a un valor
central (media), es decir, es el cuadrado de las desviaciones:
6. Propiedades
La varianza es siempre positiva o 0:
Si a los datos de la distribución les sumamos una cantidad constante
la varianza no se modifica.
Si a los datos de la distribución los multiplicamos por una constante,
la varianza queda multiplicada por el cuadrado de esa constante.
7. Propiedad distributiva:
siempre y cuando las variables X y Y sean independientes.
Coeficiente de Variación:
Es un estadístico de dispersión que tiene la ventaja de que no lleva
asociada ninguna unidad, por lo que nos permitirá decir entre dos
muestras, cual es la que presenta mayor dispersión. La denotaremos
por C.V.
Ejemplo
Veamos por último un ejemplo de cómo se calculan todas estas medidas.
9. Los estudios estadísticos permiten hacer inferencias de una
característica de una población a partir de la información contenida en una
muestra.
Los métodos numéricos que describen a los conjuntos de
observaciones tienen como objetivo dar una imagen mental de la
distribución de frecuencias. Una vez localizado el centro de la distribución de
un conjunto de datos, lo que procede es buscar una medida de dispersión de
los datos.
La dispersión o variación es una característica importante de un
conjunto de datos porque intenta dar una idea de cuán esparcidos se
encuentran éstos.
Existen diversas medidas de dispersión, algunas de ellas son:
• Rango • Desviación media • Desviación estándar • Varianza
La dispersión indica que tan cercanos o lejanos se encuentran los
valores unos de otros.
Dichos valores pueden pertenecer a un conjunto de datos agrupados
(distribuciones de frecuencias) o no agrupados (ordenados de acuerdo a su
magnitud).
Las medidas de dispersión que son más comunes son: rango,
desviación media, desviación estándar, varianza. Las medidas de dispersión
que utilizan la media como referencia son: desviación media, desviación
estándar, varianza. Las medidas de dispersión vistas fueron para datos
muéstrales.