2. Estadística
Estadística
La estadística es una ciencia y una rama de las matemáticas a través de la cual se recolecta, analiza, describe y
estudia una serie de datos a fin de establecer comparaciones o variabilidades que permitan comprender un
fenómeno en particular.
La estadística se vale, en gran medida, de la
observación para la recolección de datos que
posteriormente serán analizados y comparados a fin
de obtener un resultado.
Se trata de una ciencia que puede ser aplicada
más allá de las ciencias, ya que la estadística
también es aplicada en diversos estudios en las
áreas de las ciencias sociales, ciencias de la
salud, economía, negocios y en diversos estudios
de tipo gubernamental.
3. Estadística
El objetivo de la estadística es tanto ofrecer un resultado numérico como exponer de qué manera se está
desarrollando una situación en específico. De allí que tras un análisis estadístico se pueda comprender un
hecho, tomar decisiones, estudiar problemas sociales, ofrecer datos y soluciones en determinados casos,
deducir datos en relación a una población, entre otros.
La estadística se emplea para estudiar una población
o muestra sobre el que se pretende obtener una
información en particular, de esta manera se puede
ofrecer una solución a un problema o ver cómo ha
variado una situación en específico.
De allí que tras un análisis estadístico se pueda
comprender un hecho, tomar decisiones, estudiar
problemas sociales, ofrecer datos y soluciones en
determinados casos, deducir datos en relación a una
población, entre otros.
Población y muestra.
El objetivo de la estadística es tanto ofrecer un resultado numérico como exponer de qué manera se está
desarrollando una situación en específico. De allí que tras un análisis estadístico se pueda comprender un
hecho, tomar decisiones, estudiar problemas sociales, ofrecer datos y soluciones en determinados casos,
deducir datos en relación a una población, entre otros.
La estadística se emplea para estudiar una población
o muestra sobre el que se pretende obtener una
información en particular, de esta manera se puede
ofrecer una solución a un problema o ver cómo ha
variado una situación en específico.
De allí que tras un análisis estadístico se pueda
comprender un hecho, tomar decisiones, estudiar
problemas sociales, ofrecer datos y soluciones en
determinados casos, deducir datos en relación a una
población, entre otros.
Población y muestra.
4. Estadística
El concepto de población en estadística va más allá de lo
que comúnmente se conoce como tal. Una población se
precisa como un conjunto finito o infinito de personas u
objetos que presentan características comunes. El tamaño
que tiene una población es un factor de suma importancia en
el proceso de investigación estadística, y este tamaño viene
dado por el número de elementos que constituyen la
población
Según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra
la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de
todos los números positivos.
Población.
Una población finita es aquella que está formada por un limitado número de elementos, por ejemplo; el número de
habitantes de una comarca.
Cuando la población es muy grande, es obvio que la observación y/o medición de todos los elementos se
multiplica la complejidad, en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este
inconveniente se utiliza una muestra estadística.
5. Estadística
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos.
En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo
denominada muestra.
La muestra es una representación
significativa de las características de una
población, que bajo, la asunción de un error
(generalmente no superior al 5%) estudiamos
las características de un conjunto poblacional
mucho menor que la población global.
Muestra.
Por ejemplo estudiamos los valores sociales de una población de 5000 habitantes aprox., entendemos que sería
de gran dificultad poder analizar los valores sociales de todos ellos, por ello, la estadística nos dota de una
herramienta que es la muestra para extraer un conjunto de población que represente a la globalidad y sobre la
muestra realizar el estudio. Una muestra representativa contiene las características relevantes de la población
en las mismas proporciones que están incluidas en tal población.
6. Estadística
Una variable estadística es el conjunto de valores que puede tomar cierta característica de la población sobre
la que se realiza el estudio estadístico y sobre la que es posible su medición. Estas variables pueden ser: la
edad, el peso, las notas de un examen, los ingresos mensuales, las horas de sueño de un paciente en una
semana, el precio medio del alquiler en las viviendas de un barrio de una ciudad, etc.
Variables estadísticas.
Las variables estadísticas se pueden clasificar por diferentes criterios. Según su medición existen dos tipos de
variables:
Cualitativa (o categórica): son las variables que pueden tomar
como valores cualidades o categorías. Por ejemplo, Sexo
(hombre, mujer) o Salud (buena, regular, mala).
Cuantitativas (o numérica): variables que toman valores
numéricos. Por ejemplo, número de alumnos (1, 2,…).
Discreta. Alturas en categorías (1,50-1,55; 1,55-1,60; 1,60-
1,65…). Continua.
7. Estadística
Las variables cualitativas (o atributos) son las que no toman valores numéricos. Los valores que toma una
variable cualitativa se llaman modalidades…
Color (blanco, rojo, azul,…)
Lateralidad (zurdo, diestro)
Nota examen (suspenso, aprobado, notable, sobresaliente)
Nivel económico (pobre, clase media, rico)
Medalla deportiva (Oro, plata, bronce)
Sexo (mujer, hombre).
Enfermo (si, no).
Variables estadísticas.
8. Estadística
Las variables cuantitativas se clasifican según el número de valores que puede tomar la variable.
Variables estadísticas.
VARIABLES CUANTITATIVAS
Discreta La variable solo puede
tomar valores en número
determinado de valores.
En cada intervalo de
valores la variable solo
puede tomar un valor.
Canastas en un partido.
(20; 21; 22; pero no 21,5)
Continua La variable puede adquirir
cualquier valor dentro de
un intervalo de valores
determinado.
Peso.
(53,53 kg; 89,4 kg,…)
9. Estadística
Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es
decir, recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le
asocian determinados números que representan el número de veces que ha aparecido, su proporción con
respecto a otros valores de la variable, etc. Estos números se denominan frecuencias.
Frecuencia
Color de ojos Personas
marrones 20
verdes 5
azules 4
ámbar o amarillento 2
violeta 1
negros 1
rojo 1
La frecuencia absoluta de una variable estadística es el número de
veces que aparece en la muestra dicho valor de la variable, la
representaremos por ni
La frecuencia absoluta, es una medida que está influida por el tamaño
de la muestra, al aumentar el tamaño de la muestra aumentará también
el tamaño de la frecuencia absoluta. Esto hace que no sea una medida
útil para poder comparar. Para esto es necesario introducir el concepto
de frecuencia relativa, que es el cociente entre la frecuencia absoluta y
el tamaño de la muestra. La denotaremos por fi
13. Estadística
Las medidas de posición proporcionan información resumida de la variable objeto de estudio. En el campo social
y educativo las medidas de tendencia central que se usan más frecuentemente son la media aritmética, la
mediana, los percentiles y la moda. A continuación desarrollaremos dichos temas.
Medidas de posición y dispersión. Medidas de posición.
Media aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir
el resultado entre el número total de datos. N
x
x i
Media aritmética para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de
la media es:
i
ii
Σf
xf
x
14. Estadística
Mediana
La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a
mayor. La mediana se representa por Me. La mediana se puede hallar solo para variables cuantitativas.
Cálculo de la mediana
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma
3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
Ejemplos
Datos 1, 3, 5, 6, 2, 3, 4, 7, 1
1. Ordenamos los datos 1, 1, 2, 3, 3, 4, 5, 6, 7
2. Como es impar se selecciona el valor central…
Ejemplos
Datos 12, 14, 12, 11, 10, 15, 15, 16, 16, 17
1. Ordenamos los datos 10, 11, 12, 12, 14, 15, 15, 16, 16, 17
2. Como es par se calcula la media de las medidas centrales…
3Me
5,14
2
1514
Me
15. Estadística
Moda estadística
La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.
En el caso de tabla de frecuencias, el dato que tenga mayor frecuencia será la moda.
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones
adyacentes.
Ejemplos
Datos 12, 14, 12, 11, 10, 15, 15, 15, 16, 16, 17
15MO
Nota.-
La desventaja de la moda frente a la media y la mediana es que en su determinación no se utiliza toda la
información de los valores observados de la variable, ya que sólo interesa el de mayor frecuencia.
16. Estadística
Medidas de dispersión. Parámetros estadísticos que indican como se alejan los datos respecto de la media
aritmética. Sirven como indicador de la variabilidad de los datos. Las medidas de dispersión más utilizadas son
el rango, la desviación estándar y la varianza.
Medidas de posición y dispersión. Medidas de dispersión.
Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la diferencia entre el
mayor y el menor valor de la variable. Se denota como R.
1n xxR Siendo x1 el valor menor y xn el valor mayor.
Ejemplos
Datos 12, 14, 12, 11, 10, 15, 15, 16, 16, 17
0171R
17. Estadística
Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto a la media. Tenemos
dos casos:
Desviación media para datos.
N
xx
D.M.
i
Desviación media para datos agrupados.
i
ii
Σf
xxf
D.M.
18. Estadística
Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto a la media.
Corresponde a la media aritmética de los cuadrados de las desviaciones respecto a la media. Su expresión
matemática es
Varianza para datos.
Varianza para datos agrupados.
N
xx
varianza
2
i
i
2
ii
Σf
xxf
varianza
Desviación típica
La desviación estándar mide el grado de dispersión de los datos con respecto a la media. Se define como la
raiz cuadrada de la varianza según la expresión:
varianza
19. Estadística
Coeficiente de Variación
Permite determinar la razón existente entre la desviación típica y la media. Se denota como CV. El coeficiente
de variación permite decidir con mayor claridad sobre la dispersión de los datos.
x
σ
.V.C
20. N
x
x
i
Ejercicio.- Calcula la media, la desviación media, la varianza, la desviación típica, el coeficiente de variación y el
rango de la siguiente tabla de datos.
5
0,89,29,53,64,2
2,4 6,3 5,9 2,9 8,0
La media .- Sumamos todos los datos y dividimos por el número de datos.
5
5,25
1,5
5,1x
¡¡¡ATENCIÓN!!! . La media se da con la misma precisión que los datos. En este caso con un decimal.
Recorrido o Rango.- Es la diferencia entre el valor más pequeño y el mayor. Nos indica el tramo
donde se encuentran todos los valores
5,62,48,0Rango
Estadística
21. N
xx
.M.D
i
5
1,50,81,59,21,59,51,53,61,54,2
5
9,22,28,02,17,2
5
8,9
96,1 0,2
La desviación media es el valor promedio de las distancias de los datos a la media. Se
calcula sumando los valores absolutos de la resta de cada dato al valor de la media. El
valor absoluto es siempre positivo aunque la resta sea negativa
2,0.M.D
22.
N
xx
varianza
2
i
5
1,50,81,59,21,59,51,53,61,54,2
22222
5
9,22,28,02,17,2
22222
5
41,884,464,044,129,7
5
62,22
524,4 5,4
La varianza es el valor promedio de los cuadrados de las distancias de los datos a la
media. Se calcula sumando de la resta de cada dato al valor de la media elevados al
cuadrado.
5,4varianza
23. La desviación típica es la raíz cuadrada de la varianza. Este valor complementa a
la media.
varianza 5,4 1,2
La coeficiente de variación nos sirve para comparar datos de dos poblaciones
distintas. Se calcula dividiendo desviación típica entre la media.
x
σ
.V.C
1,5
1,2
4,0
0,4.V.C
24. Ejercicio.- Calcula la media, la desviación media, la varianza, la desviación típica, el coeficiente de variación
y el rango de la siguiente tabla de frecuencias.
Temperaturas(x i) Días (fi) xifi
25 8 200
23 3 69
20 5 100
24 2 48
26 3 78
21 4 84
fi=25
i
ii
f
xf
x
Temperaturas(x i) Días (fi) xifi
25 8 200
23 3 69
20 5 100
24 2 48
26 3 78
21 4 84
fi=25 xifi=579
25
579
16,23 23
La media es la suma de todos los valores por las veces que se repite cada valor(frecuencia) dividido entre la
suma de frecuencias
¡¡¡ATENCIÓN!!! . La media se da con la misma precisión que los datos. En este caso con un decimal.
25. Temperaturas(x i) Días (fi) xifi |xi-x| |xi-x| |xi-x|fi
25 8 200 |25-23|=2 2 16
23 3 69 |23-23|=0 0 0
20 5 100 |20-23|=3 3 15
24 2 48 |24-23|=1 1 2
26 3 78 |26-23|=3 3 9
21 4 84 |21-23|=2 2 8
fi=25 xifi=579 |xi-x|fi=50
i
ii
f
xxf
MD
..
25
50
2
La desviación media es el valor promedio de las distancias de los datos a la media. Se calcula
sumando los valores absolutos de la resta de cada dato al valor de la media multiplicado por las
veces que se repite (frecuencia) y dividido por la suma de frecuencias. El valor absoluto es
siempre positivo aunque la resta sea negativa
23x
¡¡¡ATENCIÓN!!! . En la tabla a la media le llamo simplemente x.
26. Temperaturas(x i) Días (fi) xifi |xi-x| |xi-x|fi (xi-x) (xi-x)2 (xi-x)2fi
25 8 200 2 16 2 4 32
23 3 69 0 0 0 0 0
20 5 100 3 15 -3 9 45
24 2 48 1 2 1 1 2
26 3 78 3 9 3 9 27
21 4 84 2 8 -2 4 16
fi=25 xifi=579 |xi-x|fi=50 (xi-x)2fi=122
i
ii
f
xxf
2
varianza
25
122
88,4
La varianza es el valor promedio de los cuadrados de las distancias de los datos a la
media. Se calcula sumando de la resta de cada dato al valor de la media elevados al
cuadrado. multiplicado por las veces que se repite (frecuencia) y dividido por la suma
de frecuencias.
9,4
23x
27. La desviación típica es la raíz cuadrada de la varianza. Este valor complementa a
la media.
varianza 9,4 2,2
La coeficiente de variación nos sirve para comparar datos de dos poblaciones
distintas. Se calcula dividiendo desviación típica entre la media.
x
VC
..
23
2,2
09,0 1,0
1,0.. VC
Recorrido o Rango.- Es la diferencia entre el valor más pequeño y el mayor. Nos indica el tramo
donde se encuentran todos los valores
62026 Rango
28. Fin de Tema
Busca enlaces a otras páginas relacionadas con el tema en…
www.juansanmartin.net