Este documento describe diferentes medidas de dispersión de datos como la varianza, desviación estándar, coeficiente de variación y coeficiente de sesgo. Explica que la varianza mide la dispersión de datos en torno a la media y cómo se calcula para datos individuales, agrupados o en intervalos. La desviación estándar es la desviación promedio de los datos con respecto a la media. El coeficiente de variación mide el grado de variabilidad de los datos y se usa para comparar distribuciones. El coeficiente de sesgo determina el grado de asimetr
1. MEDIDAS DE DISPERSIÓN
Cuantifican la dispersión de los datos en torno al centro de los datos.
Las más usuales son:
Recorrido, Rango Intercuartílico, Varianza, Desviación Estándar,
Coeficiente de Variación.
2. VARIANZA
Es la de mayor utilidad en aplicaciones estadísticas.
Se define según el ordenamiento o agrupación de los datos y su
resultado se obtiene como sigue:
Datos Individuales o no Agrupados.
∑( x −x)
2
i
V (X ) =
N
Datos Agrupados en Clases Individuales.
∑( xi − x ) 2 ⋅ ni
V (X ) =
N
Datos Agrupados en Intervalos de Clases.
k
(
∑x − x ) ⋅ mi
2 ∑m 2
i ⋅ ni
2
V (X ) = i
= i=1
−X
N N
3. DESVIACIÓN ESTÁNDAR.
Se define como la desviación promedio de los datos originales con
respecto a su media aritmética.
Se denota por:
σ = 2 VARIANZA( X )
4. PROPIEDAD DE LA DESVIACIÓN ESTÁNDAR Y LA MEDIA ARITMÉTICA.
X ±σ Contiene aproximadamente el 68% de las observaciones.
X ± 2σ Contiene aproximadamente el 95% de las observaciones.
X ± 3σ Contiene aproximadamente el 100% de las observaciones
5. COEFICIENTE DE VARIACIÓN
Entrega el “grado” o “%” de variabilidad de los datos y se utiliza para
comparar dos distribuciones en que pueden tener distinta unidad de
medida.
σ
C.V . = ⋅ 100%
x
REGLA EMPÍRICA:
Si el C.V. ≤ 35% el conjunto es homogéneo.
Si el C.V. ≥ 35% el conjunto es heterogéneo.
6. COEFICIENTE DE SESGO
SESGO: Grado de asimetría o falta de simetría de una distribución
de frecuencias. Se determina por:
X − Mo
C.Sesgo =
σ
REGLAS
Si el coeficiente de sesgo es “+” entonces el sesgo de la distribución
es positivo.
Si el coeficiente de sesgo es “–“ entonces el sesgo de la distribución
es negativo.
Si el coeficiente de sesgo es cero, entonces la distribución es
simétrica.
7. CUANTILES
Particionan el área bajo el polígono de frecuencias en más de dos
partes, siendo los usuales en cuatro, diez y cien partes.
CUARTILES: Divide la distribución de frecuencias en 4 partes.
DECILES: divide la distribución de frecuencias en 10 partes iguales.
PERCENTILES: divide la distribución de frecuencias en 100 partes
iguales.