Medidas de tendencia central posicion y dispercion
Bio 4 medidas de centralizacion
1. BIOESTADÍSTICA
TEMA Nº 3
MEDIDAS DE CENTRALIZACIÓN Y DISPERCIÓN
Las distribuciones de frecuencia son aquellas que permiten realizar un estudio de las características
particulares de las series, pero no se pueden realizar comparaciones con series similares. Las
características que podremos observar en cada distribución de frecuencias son:
a) La cantidad de mediciones realizadas.
b) El valor acerca del cual parecen agruparse los datos.
c) Las frecuencias con que se agrupan los datos alrededor de los distintos valores de la característica.
Para poder hacer análisis y comparaciones de varias series semejantes, es necesario lograr una mejor
caracterización de las mismas, concentrar más la información, y esto se logra con las:
MEDICIONES DE RESUMEN
MEDIDAS DE POSICIÓN O TENDENCIA CENTRAL
MEDIDAS DE DISPERSIÓN
MEDIDAS DE TENDENCIA CENTRAL.- Estas medidas procuran definir el centro de la distribución;
dicho centro tiene distintos significados para las diferentes personas, así se presenta gráficamente la
información, para algunas personas en que se halla la mayor frecuencia.
Las medidas de posición que se emplean más frecuentemente son:
a) Media aritmética o promedio
b) Mediana
c) Moda o modo
a) LA MEDIA ARITMÉTICA.- Es la cifra que se obtiene de dividir la suma de todos los valores
observados entre el número de observaciones.
MÉTODO DE CÁLCULO.- Veremos el cálculo de la media aritmética. La anotación que usaremos será:
x : Valor correspondiente a una observación.
n : Número de mediciones efectuadas o número de observaciones, que las determinamos contando.
x : Media o promedio.
: Suma de los valores expresados a continuación.
Con estos símbolos y de acuerdo a la definición dada del promedio, la fórmula de cálculo será:
x= x
n
Por tanto para determinar la media cuando no hay agrupación de datos, simplemente se suma el valor de
todas las observaciones y se divide entre el número de observaciones.
Apliquemos en el siguiente ejemplo la fórmula dada:
Deseamos determinar el promedio de días de internación de diez pacientes, cuya permanencia en el hospital fue:
23
2. BIOESTADÍSTICA
3, 11, 10, 7, 3, 11, 11, 9, 3, 9.
x= x = 3 + 11 + 10 + 7 – 3 + 11 + 11 + 9 + 3 + 9 = 77 = 7,7
n 10 10
Interpretemos este resultado como los días de internación que hubiese tenido los 10 pacientes si no
hubiera variaciones.
Veamos un ejemplo: Determinar la media aritmética de los siguientes números:
38,49, 24, 6 y 17.
38 – 49 – 24 – 6 – 17 = 134
134 = 26,8
5
Para determinar la media aritmética hemos sumado todas las cantidades y luego ese resultado se ha
dividido entre 5, que en el número de valores que teníamos, como se puede notar en la determinación de
la media todas las observaciones intervienen en la misma manera y por ello esta media tiene la siguiente
propiedad:
“La suma de las desviaciones positivas, respecto a la media, es igual a la suma de las desviaciones
negativas; es decir, la media en el centro de gravedad de la distribución”.
Comprobaremos la anterior propiedad:
Desviaciones positivas Desviaciones negativas
38 26,8 = 11,2 24 - 26,8 = -2,8
49 26,8 = 22,2 17 - 26,8 = -9,8
33,4 6 - 26,8 = -20,8
-33,4
LA MEDIANA
Esta es otra medida de tendencia central que se caracteriza por dividir la serie en dos partes iguales de
manera que la mitad de las observaciones son iguales o menores que dicho valor y la otra mitad iguales o
mayores que él.
Se usa la mediana cuando se presentan distribuciones asimétricas pues en ellas la media se vería influida
por los valores extremos.
Para calcular la mediana se deben ordenar las series en forma creciente, luego se determina el valor
central de la serie que constituye el valor de la mediana.
24
3. BIOESTADÍSTICA
METODOS DE CÁLCULO.- Para calcular la mediana de una serie sin agrupación de datos en primer
lugar, como ya indicamos, se la ordena en forma creciente, luego se determina la posición del valor
central utilizando la siguiente fórmula:
Ma = n + 1 = 9 + 1 = 5
2 2
La mediana ocupa el quinto lugar o sea al 6, esto significa que el 50% de las observaciones tiene un valor
igual o inferior a 6 y el otro 50% un valor igual o mayor a 6. Si la serie tiene un número par de
observaciones usamos la fórmula indicada para localizar la mediana pero como no hay un valor central
para determinar el valor de la mediana se promedian los dos valores centrales. Ejemplo:
26, 33, 36, 39, 40, 41, 42, 44, 45, 47, 48, 48
Ma = n + 1 = 12 + 1 = 6,5
2 2
El anterior cociente nos indica que la mediana se encuentra entre la sexta y séptima observaciones, es
decir entre 41 y 42, para determinar su valor promediamos las dos cifras:
41 + 42 = 41,5
42
EL MODO O MODA
El modo o moda es el valor típico, el que se observa con más frecuencia, es decir el más común de la
serie.
Esta medida de tendencia central no es muy usada en Bioestadística.
METODOS DE CÁLCULO.- Tenemos las siguientes observaciones:
14, 15, 17, 21, 21, 21, 21, 33, 33, 33, 36, 36, 36, 40
El modo en este ejemplo es 21 porque es el valor que se repite más veces.
USO DE LAS MEDIDAS DE POSICIÓN CENTRAL.- En la práctica de las medidas entes estudiados la
que más se usa es la media o promedio aritmético, que representa el centro o punto de equilibrio de la
serie o del valor que tendrían todas las observaciones si no varían; tiene las siguientes ventajas:
1) se puede calcular fácilmente.
25
4. BIOESTADÍSTICA
2) Es comprendida por todos.
3) Cada observación de la distribución contribuye a ella con igual peso.
Sin embargo hay que tener en cuenta que no se puede calcular la media cuando hay clases
abiertas o valores extremos, en este caso se usa la mediana que no se ve afectada por los
mismos.
El modo se emplea cuando hay interés en conocer el o los valores que se presentan con
mayor frecuencia.
Finalmente podemos afirmar que si la distribución de frecuencias es simétrica la media, la
mediana y el modo son idénticos, no ocurriendo así con las series asimétricas.
MEDIDAS DE POSICIÓN U ORDEN :
LOS CUARTILES O VALORES CUÁRTICOS
Esta medida proporciona una información acerca de la distribución de los valores de la serie.
Los cuarteles dividen a la serie en cuatro partes iguales, los tramos comprendidos entre los cuarteles se
denominan espacios intercuartilares. En una serie hay 3 cuartiles y 4 intercuartiles. El segundo cuartil es
igual a la mediana.
METODOS DE CÁLCULO.- El procedimiento de cálculo de los cuartiles es el mismo que el de la
mediana.
Representado con “Q” a los cuartiles, tenemos que las fórmulas para el primer y tercer cuartil son:
Q1 = (n + 1)
4
Q3 = (n + 1) x 3
4
Ejemplo:
Tenemos los siguientes datos:
1, 2, 11, 14, 28, 30, 37, 48, 52, 62, 70, 72, 84, 91, 92, 95, 100
Las 17 observaciones han sido ya ordenadas en forma creciente y aplicamos las fórmulas:
Q1 = (17 + 1) = 18 = 4,5
4 4
Q3 = (17 + 1) = 18 * 3 = 13,5
4 4
Estos resultados nos indican que:
El primer cuartil se encuentra entre la cuarta y quinta observaciones y divide a la serie dejando el 25% de
valores iguales o inferiores a él por un lado y el 75% de valores iguales o superiores por el otro.
El tercer cuartil esta entre la trece y catorce observaciones y deja el 75% de valores iguales o inferiores a
él por un lado y el 25% de valores iguales o superiores por el otro.
Determinemos los valores de estos dos cuartiles:
26
5. BIOESTADÍSTICA
Q1 = 14 + 28 = 42 = 21
2 2
Q3 = 84 + 91 = 175 = 87,5
2 2
METODO DE DISPERSION
Si los hechos no se repitieran o si se repitieran sin variaciones, la estadística no tendría razón de ser, pero
en la realidad los hechos o fenómenos generalmente se repiten y lo hacen mostrando variaciones de
mayor o menor intensidad, surgiendo ahí la repartición o variabilidad de los hechos para luego hacer
predicciones científicamente válidas.
Fundamentalmente, al realizar los análisis de un conjunto de datos, se tiene en mente dos objetivos:
a) Tratar de determinar un valor típico o central que resuma las observaciones.
b) Establecer la importancia de la dispersión de los elementos individuales con respecto a ese valor
típico o representativo elegido para representar o caracterizar la serie.
Podemos afirmar que es tan importante conocer un promedio como la variabilidad de los datos alrededor
de él porque la validez de un valor típico para resumir o representar un situación depende de la forma en
que los valores individuales se concentran o se alejan de él; cuanto más concentrados están los datos en
torno a un promedio aritmético, este caracterizara en mejor forma al conjunto de datos.
Las medidas usadas comúnmente para caracterizar la dispersión de las observaciones son:
1) Amplitud de variación
2) Desviación media
3) Desviación estándar
1) AMPLITUD DE VARIACIÓN.- Esta medida se denomina también recorrido, rango, oscilación o
módulo. Se la obtiene estableciendo la diferencia entre los valores mayor y menor de la serie.
Ejemplo:
3, 10, 2, 8, 8, 7, 9 Amplitud = 10 – 2 = 8
También se acostumbra a indicarla dando los valores extremos directamente:
Amp. = 2 a 10
Si se trata de una distribución de frecuencias la amplitud estará dada por el límite inferior del primer
intervalo y el límite superior del último intervalo.
Esta medida no obstante lo fácil de su cálculo y comprensión de su significado no es muy empleada pues
solo toma en cuenta los valores extremos de la serie que se analiza, sin considerar al resto de las
observaciones; además cualquier variación en el tamaño de las observaciones modifican su valor.
En la práctica es utilizada cuando se desea una medida simple de variabilidad o cuando por cualquier otra
circunstancia no es posible emplear medidas más complejas.
DESVIACIÓN MEDIA.- Se utiliza esta medida para caracterizar la variación en promedio de las medidas
respecto a la mediana generalmente y por tanto en distribuciones asimétricas.
Método de cálculo.- La desviación media se obtiene promediando las desviaciones de los valores
individuales son relación a la mediana, sin tomar en cuenta su signo, denominado:
27
6. BIOESTADÍSTICA
Dm = Desviación media
d = desvios
Sin agrupación de datos: la formula que se usara sera:
Dm = (x1 – Ma)
n
Los pasos que se siguen son:
a) Calcular la mediana.
b) Determinar los desvíos (x – Ma)
c) Promediar los desvíos, tomando en cuenta solo los valores absolutos y no los signos.
Esta medida no es muy empleada debido a que, por una parte, se ignoran desde el punto de vista
matemático los signos, y por otra parte, para el estudio de la dispersión se utiliza mas el desvio estándar
que determina las desviaciones de los valores individuales alrededor de la media.
Con agrupación de datos.- La formula que se usa es:
Dm = (x1 – Ma) . fi
n
Los pasos de cálculo son:
1.- Calcular la mediana.
2.- Calcular los puntos medios y restar de ellos la mediana.
3.- La diferencia antes obtenida en cada intervalo multiplicar por su respectiva frecuencia.
4.- Sumar sin tomar en cuenta el signo los productos obtenidos.
5.- Dividir al anterior total entre el número de observaciones.
Ese resultado se interpreta como la dispersión en promedio de las observaciones en torno a la mediana.
DESVIACION ESTANDAR.- Es la medida de variación que se utiliza con carácter universal para
demostrar la dispersión de los valores individuales alrededor de la media.
También es denominada desviación cuadrática media o desvio tipo.
Podemos definir el desvio estándar como la raíz cuadrada de la suma de los cuadrados de los desvios con
respecto a la media aritmética, divididos entre el número de observaciones, es decir:
Cuando se calcula la desviación estándar de una muestra o un pequeño grupo de individuos es mas exacto
dividir entre n – 1 en lugar de n.
Los desvíos se elevan al cuadrado para evitar dificultades con los signos pues con este procedimiento
todos ellos se convierten positivos y esto evita el tener que ignorar los signos, por otra parte al extraer la
raíz cuadrada del promedio de los cuadrados de las desviaciones, obtenemos la media de la dispersión en
las medidas originales.
28
7. BIOESTADÍSTICA
Dm = Desviación media
d = desvios
Sin agrupación de datos: la formula que se usara sera:
Dm = (x1 – Ma)
n
Los pasos que se siguen son:
a) Calcular la mediana.
b) Determinar los desvíos (x – Ma)
c) Promediar los desvíos, tomando en cuenta solo los valores absolutos y no los signos.
Esta medida no es muy empleada debido a que, por una parte, se ignoran desde el punto de vista
matemático los signos, y por otra parte, para el estudio de la dispersión se utiliza mas el desvio estándar
que determina las desviaciones de los valores individuales alrededor de la media.
Con agrupación de datos.- La formula que se usa es:
Dm = (x1 – Ma) . fi
n
Los pasos de cálculo son:
1.- Calcular la mediana.
2.- Calcular los puntos medios y restar de ellos la mediana.
3.- La diferencia antes obtenida en cada intervalo multiplicar por su respectiva frecuencia.
4.- Sumar sin tomar en cuenta el signo los productos obtenidos.
5.- Dividir al anterior total entre el número de observaciones.
Ese resultado se interpreta como la dispersión en promedio de las observaciones en torno a la mediana.
DESVIACION ESTANDAR.- Es la medida de variación que se utiliza con carácter universal para
demostrar la dispersión de los valores individuales alrededor de la media.
También es denominada desviación cuadrática media o desvio tipo.
Podemos definir el desvio estándar como la raíz cuadrada de la suma de los cuadrados de los desvios con
respecto a la media aritmética, divididos entre el número de observaciones, es decir:
Cuando se calcula la desviación estándar de una muestra o un pequeño grupo de individuos es mas exacto
dividir entre n – 1 en lugar de n.
Los desvíos se elevan al cuadrado para evitar dificultades con los signos pues con este procedimiento
todos ellos se convierten positivos y esto evita el tener que ignorar los signos, por otra parte al extraer la
raíz cuadrada del promedio de los cuadrados de las desviaciones, obtenemos la media de la dispersión en
las medidas originales.
28
8. BIOESTADÍSTICA
Dm = Desviación media
d = desvios
Sin agrupación de datos: la formula que se usara sera:
Dm = (x1 – Ma)
n
Los pasos que se siguen son:
a) Calcular la mediana.
b) Determinar los desvíos (x – Ma)
c) Promediar los desvíos, tomando en cuenta solo los valores absolutos y no los signos.
Esta medida no es muy empleada debido a que, por una parte, se ignoran desde el punto de vista
matemático los signos, y por otra parte, para el estudio de la dispersión se utiliza mas el desvio estándar
que determina las desviaciones de los valores individuales alrededor de la media.
Con agrupación de datos.- La formula que se usa es:
Dm = (x1 – Ma) . fi
n
Los pasos de cálculo son:
1.- Calcular la mediana.
2.- Calcular los puntos medios y restar de ellos la mediana.
3.- La diferencia antes obtenida en cada intervalo multiplicar por su respectiva frecuencia.
4.- Sumar sin tomar en cuenta el signo los productos obtenidos.
5.- Dividir al anterior total entre el número de observaciones.
Ese resultado se interpreta como la dispersión en promedio de las observaciones en torno a la mediana.
DESVIACION ESTANDAR.- Es la medida de variación que se utiliza con carácter universal para
demostrar la dispersión de los valores individuales alrededor de la media.
También es denominada desviación cuadrática media o desvio tipo.
Podemos definir el desvio estándar como la raíz cuadrada de la suma de los cuadrados de los desvios con
respecto a la media aritmética, divididos entre el número de observaciones, es decir:
Cuando se calcula la desviación estándar de una muestra o un pequeño grupo de individuos es mas exacto
dividir entre n – 1 en lugar de n.
Los desvíos se elevan al cuadrado para evitar dificultades con los signos pues con este procedimiento
todos ellos se convierten positivos y esto evita el tener que ignorar los signos, por otra parte al extraer la
raíz cuadrada del promedio de los cuadrados de las desviaciones, obtenemos la media de la dispersión en
las medidas originales.
28