Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
ESTADÍSTICA INFERENCIAL I.docx
1. ESTADÍSTICA INFERENCIAL I
Tema: La Varianza
¿Qué Es?
La varianza es una medida de dispersión definida como la esperanza
del cuadrado de la desviación de dicha variable respecto a su media.
Formalmente se calcula como la suma de los residuos al cuadrado
divididos entre el total de observaciones.
¿Para Qué sirve? vv
Ronald Fisher Mencionó que esta serviría para saber y considerar el
valor medio de una variable.
V2 1 2 3 4 5 6 7 8 9
1 648 799 864 900 922 937 948 957 963
2 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36
9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03
10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78
11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.664 3.588
12 6.55 5.10 4.47 4.12 3.89 3.728 3.607 3.512 3.436
13 6.41 4.97 4.35 4.00 3.767 3.604 3.483 3.388 3.312
14 6.30 4.86 4.24 3.892 3.663 3.501 3.380 3.285 3.209
V1 Grados De Libertad Del Numerador y V2 Grados De Libertad Del Denominador
2. ESTADÍSTICA INFERENCIAL I
Tema: Error Tipo I
Comúnmente identificados como “falsos positivos” aparecen
cuando una hipótesis nula es cierta, pero se rechaza.
Una hipótesis nula es una afirmación general, o una creencia
predeterminada, de que no existe una relación entre dos
fenómenos que han sido medidos.
En pocas palabras, los errores de Tipo I son ‘falsos positivos’ se
producen cuando se da por válida una diferencia estadísticamente
significativa, aunque realmente no exista una. Los errores de Tipo I
tienen una probabilidad de “α” correlacionado con el nivel de
confianza que hayas establecido. Un test con un nivel de confianza
del 95% revela que existe una probabilidad del 5% de obtener un
error de Tipo I.
3. ESTADÍSTICA INFERENCIAL I
Tema: Error Tipo II
El error tipo II (β) se comete cuando el investigador no rechaza la
hipótesis nula siendo esta falsa en la población. Es equivalente a la
probabilidad de un resultado falso negativo, ya que el investigador
llega a la conclusión de que ha sido incapaz de encontrar una
diferencia que existe en la realidad.
El error tipo II (β) está relacionado con la potencia de la prueba, la
cual es el complemento de este error (1- β).
La potencia depende de tres factores:
1) Depende de α, mientras menor sea su probabilidad, menor es
la potencia.
2) El tamaño de la muestra, a mayor tamaño muestral mayor
potencia.
3) La magnitud del efecto, a mayor magnitud mayor potencia.
Cuando la hipótesis nula es falsa y usted no la rechaza, comete un
error de tipo II. La probabilidad de cometer un error de tipo II es β, que
depende de la potencia de la prueba.
Puede reducir el riesgo de cometer un error de tipo II al asegurarse de
que la prueba tenga suficiente potencia. Para ello, asegúrese de que el
tamaño de la muestra sea lo suficientemente grande como para
detectar una diferencia práctica cuando está realmente exista.
4. ESTADÍSTICA INFERENCIAL I
Tema: Prueba De Hipótesis z Para La Media
(Desviación Estándar Poblacional Conocida)
¿Qué Es Una Prueba De Hipótesis?
La prueba de hipótesis es un procedimiento basado en la evidencia de
la muestra y la teoría de las probabilidades, usadas para determinar si
la hipótesis es una declaración razonable y no debe ser rechazada o es
irrazonable y debe ser rechazada.
Prueba De Hipótesis
o Se plantean las hipótesis nula y alternativa
o Se selecciona el nivel de significancia
o Se identifica el estadístico de prueba
o Se formula la regla de decisión
o Se toma una muestra y se decide: acierta lO o se rechaza HO
DEFINICIONES
Una declaraciónsobreel valor de un parámetro
de la población
Hipótesis Nula HO
Una declaraciónque se acepta si los datos de la
muestraproporcionan evidenciade que la
hipótesis nulaes falsa.
Hipótesis
Alternativa H1
5. ¿Qué Es Una Prueba “Z”? vv
o Una prueba Z es una prueba de hipótesis basada en el estadístico Z,
que sigue la distribución normal estándar bajo la hipótesis nula.
o La prueba Z más simple es la prueba Z de 1 muestra, la cual evalúa
la media de una población normalmente distribuida con varianza
conocida.
La probabilidadde rechazar la hipótesis nula
cuando es verdadera.
Nivel de
Significancia
Rechazar la Hipótesis Nulacuando es
verdadera.
Error Tipo I
Aceptar la hipótesisnula cuando es falsa.
Error Tipo 2
Un valor determinadoa partir de la información
muestral,usado para determinar si se rechaza la
hipótesis Nula.
Estadístico De
Prueba
Punto de división entre la región en la que se rechaza la Hipótesis Nula y la
región en la que rechazo la HipótesisNula
6. o También puede utilizar las pruebas Z para determinar si las variables
predictoras en los análisis probit y en la regresión logística tienen un
efecto significativo en la respuesta.
o La hipótesis nula indica que el predictor no es significativo.
o También tiene la opción de utilizar una prueba Z para realizar una
aproximación a la normal para las pruebas de tasa de Poisson y las
pruebas de proporciones. Estas aproximaciones esa la normal son
válidas cuando el tamaño de la muestra y el número de eventos son
adecuadamente grandes.
Desviación Estándar
Poblacional
La desviación estándar es un indicador en extremo
valioso con muchas aplicaciones. Por ejemplo, los
estadísticos saben que cuando un conjunto de
datos se distribuye de manera “normal”, el 68% de
las observaciones de la distribución tiene un valor
que se encuentra a menos de una desviación
estándar de la media.
7. Desviación estándar
poblacional
La desviación estándar de una población
es normalmente representada por la
letra griega (sigma),cuando se calcula sobre la base de toda la
población; por la letra s (minúscula) cuando se infiere de una muestra;
y por la letra S (mayúscula) cuando simplemente corresponde a la
desviación estándar de una muestra.
La Fórmula De La Desviación
Estándar:
𝝈 = √
∑ (𝒙𝒊 − 𝒙)𝟐
𝒏
𝒊=𝟏
𝒏
-
8. ESTADÍSTICA INFERENCIAL I
Tema 3.5 : Prueba Para Proporciones
Prueba De Proporciones
Las pruebas de proporciones son adecuadas cuando los datos que se
están analizando constan de cuentas o frecuencias de elementos de
dos o más clases. El objeto de estas pruebas es evaluar las
afirmaciones con respecto a una proporción (o porcentaje) de
población.
Las pruebas se basan en la premisa de que una proporción muestral
(es decir, x ocurrencias en n observaciones, o x/n) será igual a la
proporción verdadera de la población si se toman márgenes o
tolerancias para la variabilidad muestral.
Las pruebas suelen enfocarse en la diferencia entre un número
esperado de ocurrencias, suponiendo que una afirmación es
verdadera, y el número observado realmente. La diferencia se compara
con la variabilidad prescrita mediante una distribución de muestreo
que tiene como base el supuesto de que H0 es realmente verdadera.
9. El objeto de una prueba de dos muestras es determinar si las dos
muestras independientes fueron tomadas de dos poblaciones, las
cuales presentan la misma proporción de elementos con determinada
característica. La prueba se concentra en la diferencia relativa
(diferencia dividida entre la desviación estándar de la distribución de
muestreo) entre las dos
proporciones muestrales.
La hipótesis nula en una
prueba de dos muestras es
H0: P1 = P2
Las hipótesis alternativas
son:
Fórmula De Prueba De
Proporciones:
𝒛 =
𝑷𝒐 + 𝑷𝒄
√𝑷𝒄(𝟏 − 𝑷𝑪)
𝒏
Prueba De Proporciones De Dos Muestras
10. H1:P1 ≠ P2 H1: P1 > P2 H1: P1 < P2
ESTADÍSTICA INFERENCIAL I
Tema 3.6 : Selección Del Tamaño De La Muestra
(Para Estimar La Media Poblacional)
Selección Tamaño De Muestra
o Una preocupación frecuente al diseñar un estudio estadístico
consiste en cuántos elementos debe haber en una muestra.
o Si una muestra es demasiado grande, se gasta mucho dinero en
recabar datos.
o Si la muestra es muy pequeña, las conclusiones resultarán inciertas.
La Estimación combinada de p se puede calcular de la siguiente
manera:
𝑷 =
𝑿𝟏 + 𝑿𝟐
𝒏𝟏 + 𝒏𝟐
en la cual:
x₁= número deaciertos en la muestra1
x₂ = número deaciertos en la muestra2
n₁ =número de observaciones de la muestra1
n₂ =número de observaciones de la muestra2
11. El Tamaño Adecuado De Una Muestra Depende De Tres
Factores:
1. El nivel de confianza deseado. (los más comunes son de 95% y
99%).
2. El margen de error que tolerará el investigador. (corresponde a la
mitad de la amplitud del intervalo de confianza, entre más pequeño
mayor el tamaño de muestra, entre más grande menor la muestra).
3. La variabilidad de la población que se estudia. (la población esta
dispersa mayor tamaño de muestra, si esta más concentrada menor
tamaño).
Existen distintas formas de encontrar el tamaño de muestra en este
tema veremos usando:
Situación
Para Estimar La Media Poblacional
()
N es Infinita
Donde: 𝑛 = (
𝑍∝/2𝜎
𝑒
)2
𝑍∝/2 = 𝑆𝑒 𝑑𝑒𝑓𝑖𝑛𝑒 𝑠𝑒𝑔ú𝑛 𝑒𝑙 𝑁.𝐶.
𝜎 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟
𝜎 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟
12. N es Finita (Conocida) 𝑛 =
𝑍2
∝/2𝜎𝑁𝜎2
𝜎2𝑍𝑎/2
2
+ (𝑁 − 1)𝑒2
ESTADÍSTICA INFERENCIAL I
Tema 3.7 : La Selección Del Tamaño De Muestra
Para Estimar La Proporción Poblacional.
o Al momento de calcular el tamaño muestral para la estimación de
una proporción tendremos que establecer un nivel de confianza y la
precisión que nosotros deseamos que tenga nuestra estimación de
13. la prevalencia, sin olvidar del que el tamaño muestral necesario
podrá variar según el valor de esta prevalencia.
o Por otra parte la muestra nos dice que es una selección de los
encuestados elegidos y que representan a la población total. El
tamaño de la muestra es una porción significativa de la población
que cumple con las características de la investigación reduciendo
los costos y el tiempo.