3. Conceptos básicos
Población
Conjunto formado por
la totalidad de
individuos, objetos o
medidas de interés
sobre los que se
realiza un estudio.
Parámetro
Es un valor
representativo y
descriptivo de una
población, como la
media μ o la
desviación estándar σ.
Muestra
representativa
Parte de una
población, seleccionada
de manera
adecuada, que
conserva las
características más
importantes de dicha
población..
4. Inferencia Estadistica
La inferencia estadística tiene
como objetivo establecer las
características de una población
o proceso con base en la
información contenida en una
muestra. Por lo general, la
inferencia se divide en
estimación y prueba de
hipótesis, y se apoya en
cantidades o estadísticos
calculados de las observaciones
de la muestra.
5.
Inferencia
estadística
Se refiere a
establecer las
características de
una población o
proceso con base
en la información
contenida en una
muestra.
Estadístico
Medidas o
funciones de los
datos muestrales
que ayudan a
caracterizar la
distribución de tales
datos.
Distribución de
una variable
aleatoria X
Relaciona el
conjunto de los
valores posibles de
X con la
probabilidad
asociada a éstos.
6. Estimación puntual y por intervalo
Una población se
caracteriza por una
variable aleatoria y
ésta, a su vez, por su
distribución de
probabilidad. Por lo
general, una
distribución depende
de paráme tros que, si
se desconocen, será
necesario estimarlos
con base en los da tos
muestrales.
7.
El estimador puntual de un parámetro es un estadístico
que genera un valor numérico simple, y que se utiliza
para proporcionar una estimación del valor del parámetro
desconocido.
La media μ del proceso (población).
La varianza σ 2 o la desviación estándar σ del proceso.
La proporción p de artículos defectuosos.
Los estimadores puntuales (estadísticos) más
recomendados para estimar estos parámetros son,
respectivamente:
La media muestral μˆ = X
La varianza muestral σˆ 2 = S2
La proporción de defectuosos en la muestra, pˆ =X/n , donde X
es el número de artículos defectuosos en una muestra de
tamaño n.
8.
9. Estimación por intervalo
Como la estimación puntual de un parámetro se
genera a través de un estadístico, y como el
valor de éste es aleatorio porque depende de
los elementos que fueron seleccionados en la
muestra, entonces la estimación que se hace
sobre el parámetro dependerá y variará de una
muestra a otra. De esta forma, cuando se
quiere tener mayor certidumbre acerca del
verdadero valor del parámetro poblacional, será
necesario obtener la información sobre qué tan
precisa es la estimación puntual.
10.
Una forma de saber qué tan variable es el estimador
consiste en calcular la desviación estándar o error
estándar del estadístico, visto como una variable
aleatoria.
Una forma operativa de saber qué tan precisa es la
estimación consiste en calcular un intervalo de
confianza que indique un rango “donde puede estar
el parámetro” con cierto nivel de seguridad o
confianza.
11.
Para construir un intervalo al 100(1 − α)% de confianza
para un parámetro desconocido θ consiste en estimar
dos números (estadísticos) L y U, de manera que la
probabilidad de que θ se encuentre entre ellos sea 1 − α,
es decir:
P(L ≤ θ ≤ U) = 1 − α
donde L y U forman el intervalo de confianza buscado [L,
U].
12. Intervalo de confianza para una media
Si se trata de encontrar dos números L y U, tales que el parámetro μ
se encuentre entre ellos con una probabilidad de 1 − α. Esto es,
Sea xl, x2, ..., xn una muestra aleatoria de tamaño n de una
población, con una distribución normal con media μ y varianza σ 2,
ambas desconocidas. El procedimiento general para deducir el
intervalo consiste en partir de un estadístico que involucra al
parámetro de interés y que tenga una distribución conocida. En el
caso de μ, tal estadístico es:
13. el cual tiene una distribución T de Student con n − 1 grados de libertad.
Por lo tanto, en la tabla de esta distribución o en su gráfica se pueden
ubicar dos valores críticos tα/2 y −tα/2,
tales que:
De aquí, al despejar hasta dejar al parámetro de interés sólo en
medio de las desigualdades, se llega a que
14. Ejemplo
Recordemos se tiene un proceso de inyección de
plástico donde una característica de calidad del
producto (disco) es su grosor, que debe ser de 1.20
mm con una tolerancia de ±0.10 mm. Para evaluar
esta característica de calidad, durante una semana
se realiza un muestreo sistemático en una línea de
producción y se obtienen 25 muestras de tamaño 5
cada una. Por lo tanto, al final se tiene una muestra
de n = 125 y se obtiene la media muestral, X= 1.179
mm y la varianza, S2 = 0.00071.
16. Tamaño de muestra
En ocasiones es necesario calcular el tamaño de
muestra n para lograr que la estimación de una
media poblacional μ tenga como error máximo a un
número E. En este caso, como el error de
estimación está dado por E=t(α /2, n−1)S/n, entonces
despejando n se obtiene que:
Como t (α/2, n−1) depende de n, y ésta es la incógnita,
entonces para propósitos prácticos y con tamaños
de muestra mayores que 30, el valor de t (α/2,n−1)
puede tomarse como 2. De esta manera,
17. Ejemplo
En el caso del grosor medio de los discos se
quisiera un error máximo de estimación de 0.004 =
E, entonces se requiere un tamaño de muestra de
18. Intervalo para una varianza
De manera similar a como se obtiene el intervalo
para la media es posible deducir intervalos de
confianza para cualquier parámetro. Por ejemplo, si
se desea obtener un intervalo de confianza para la
varianza σ2 poblacional, tal que:
Entonces, la distribución de referencia es una jicuadrada con n – 1 grados de libertad, ya que bajo
el supuesto de que la variable o población de interés
tiene una distribución normal con media y varianza
desconocidas, el estadístico
19.
tiene esta distribución ji-cuadrada con n – 1 grados
de libertad. Con un poco de álgebra se llega a que el
intervalo de confianza para la varianza está dado
por
20. Ejemplo
En el proceso de fabricación de discos para
computadoras una de las variables críticas es el
rendimiento del formato. Se toma una muestra
aleatoria de n = 10 discos de la producción del
último turno, se formatean y se reporta el
rendimiento de cada disco. Los datos obtenidos son:
96.11, 91.06, 93.38, 88.52, 89.57, 92.63, 85.20, 91.41, 89.79, 92.62
21. Solución:
a) Determinar la media y la desviación estándar
b) Determinar el intervalo al 95% de confianza para la
media.
c) Determinar el intervalo al 95% de confianza para la
varianza.