2. Intervalo de confianza
En estadística, se llama intervalo de confianza a un par de
números entre los cuales se estima que estará cierto valor
desconocido con una determinada probabilidad de acierto.
Formalmente, estos números determinan un intervalo, que se
calcula a partir de datos de una muestra, y el valor desconocido
es un parámetro poblacional. La probabilidad de éxito en la
estimación se representa con 1 - α y se denomina nivel de
confianza. En estas circunstancias, α es el llamado error aleatorio o
nivel de significación, esto es, una medida de las posibilidades de
fallar en la estimación mediante tal intervalo.1
El nivel de confianza y la amplitud del intervalo varían
conjuntamente, de forma que un intervalo más amplio tendrá más
posibilidades de acierto (mayor nivel de confianza), mientras que
para un intervalo más pequeño, que ofrece una estimación más
precisa, aumentan sus posibilidades de error.
3. Para la construcción de un determinado
intervalo de confianza es necesario conocer
la distribución teórica que sigue el parámetro
a estimar, θ. Es habitual que el parámetro
presente una distribución normal. También
pueden construirse intervalos de confianza
con la desigualdad de Chebyshov.
En definitiva, un intervalo de confianza al 1 - α
por ciento para la estimación de un
parámetro poblacional θ que sigue una
determinada distribución de probabilidad, es
una expresión del tipo [θ1, θ2] tal que P[θ1 ≤
θ ≤ θ2] = 1 - α, donde P es la función de
distribución de probabilidad de θ.
4. Intervalo de confianza para la media
de una población
De una población de media y desviación típica
se pueden tomar muestras de elementos. Cada
una de estas muestras tiene a su vez una media ().
Se puede demostrar que la media de todas las
medias muestrales coincide con la media
poblacional:2
Pero además, si el tamaño de las muestras es lo
suficientemente grande,3 la distribución de
medias muestrales es, prácticamente, una
distribución normal (o gaussiana) con media μ y
una desviación típica dada por la siguiente
expresión.
5. Laprobabilidad de que el verdadero
valor del parámetro se encuentre en el
intervalo construido se denomina nivel de
confianza, y se denota 1-. La
probabilidad de equivocarnos se llama
nivel de significancia y se simboliza .
Generalmente se construyen intervalos
con confianza 1-=95% (o significancia
=5%). Menos frecuentes son los intervalos
con =10% o =1%.
6. Para construir un intervalo de confianza,
se puede comprobar que la distribución
Normal Estándar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(loanterior se puede comprobar con una
tabla de probabilidades o un programa
computacional que calcule
probabilidades normales).
7. Luego, si una variable X tiene distribución N(,),
entonces el 95% de las veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el
95% de las veces. Es decir, es un intervalo de
confianza al 95% para la media cuando la
variable X es normal y es conocido.
8. Uso de Intervalos de Confianza para verificar
Hipótesis.
Los intervalos de confianza permiten verificar hipótesis
planteadas respecto a parámetros poblacionales.
Por ejemplo, supongamos que se plantea la hipótesis de
que el promedio de peso de nacimiento de cierta
población es igual a la media nacional de 3250 gramos.
Al tomar una muestra de 30 recién nacidos de la
población en estudio, se obtuvo:
x= 2930
s= 450
n= 30
9. Al construir un intervalo de 95% de confianza
para la media poblacional, se obtiene:
Luego, el peso de nacimiento varía entre
2769 y 3091 gramos, con una confianza de
95%.
Como el intervalo no incluye el valor =3250
gramos planteado en la hipótesis, entonces
esta es rechazada con confianza 95% (o un
valor p menor a 0,5).