1. Test de Chi-Cuadrado de Pearson
MARTA SÁNCHEZ ELICES
ESTADÍSTICA Y TICs U.D. Virgen del Rocío
GRUPO PEQUEÑO: 16
2. Establecer hipótesis nula
Realizar una tabla con los datos observados o frecuencias observadas
Calcular Grados de Libertad
Calcular frecuencias esperadas
Utilizar el estadístico
Compararlo con las tablas a nivel de significación fijadas.
Aceptar o rechazar la H0
3. Ejemplo de ejercicio: Un enfermero de la unidad de digestivo observa que se
producen diferencias relacionadas con los meses en los reingresos de pacientes con úlcera
gástrica. Recoge los siguientes datos:
• En primer lugar establecemos cuál será la hipótesis nula:
H0: no hay relación entre el mes del año y los reingresos.
En 2014 ha habido 48 reingresos.
• Si se cumpliera la hipótesis nula: lo esperado sería, si tenemos 12 meses, 4 ingresos al
mes.
• Variable independiente: mes, que tiene 12 categorías. (Mientras más categorías tenga la
variable, más probabilidad de que me salga un valor esperado menor a 5. Para poder hacer
el test de Chi cuadrado, lo que puedo hacer es convertir los meses, en estaciones del
año, por lo que solo habría 4 categorías).
4. Voy a reagrupar la variable independiente, en estaciones: el mes lo voy a convertir en
estaciones. Lo esperado sería:
• Invierno (enero, febrero, marzo): 12 reingresos
• Primavera (abril, mayo, junio): 12
• Verano (julio, agosto, septiembre): 12
• Otoño (octubre, nov, diciembre): 12
Lo observado es diferente (según la tabla de la diapositiva):
• Invierno: 7
• Primavera: 15
• Verano: 6
• Otoño: 20
Variable dependiente: reingreso. Tiene 2 categorías (Sí, No).
5. Se trata de ver si hay diferencia entre lo observado y lo esperado.
¿Cómo calculamos el test Chi-cuadrado?
- Grados de libertad [(nº categorías V.I) – 1)] x [( nº categorías V.D) – 1]
(4-1) x (2-1) = 3
Calculamos el valor de Chi-cuadrado mediante la fórmula:
• fo= frecuencia observada
• fe = frecuencia esperada
Aplicamos la fórmula, en este caso el resultado de Chi-cuadrado es: 11,16
Normalmente los investigadores aceptan un máximo de 5 % de error. Eso es lo que se llama nivel
de significación p < 0,05.
Correspondencia inversa: mientras más alta sea Chi-cuadrado, más pequeño es el error (p)
6. Miramos en la tabla:
- Grados de libertad: 3
- Nivel de significación: 0,05
En este caso Chi-cuadrado vale: 7,82.
Como nuestro resultado es de 11,16 (mayor que 7,82), el nivel de significación
será menor que 0,05.
- Cuando el nivel de significación es menor: rechazamos la hipótesis nula.
- Cuando el nivel de significación es mayor: aceptamos la hipótesis nula.
En este caso, rechazamos la hipótesis nula. Por ello decimos: si existe relación
entre las estaciones y los reingresos.
Se acumulan los reingresos en otoño y en primavera.
7. Ejercicio 1: Un estudio para saber si la pertenencia a
barriadas más pobres influye en la obesidad infantil.
Nivel de significación de 0,01
Ho: la pertenencia a barriadas más pobres no influye en la obesidad infantil.
Hemos recogido unos datos:
Calculamos los totales:
20 45
70 26
Barrio pobre Barrio rico
Obesidad infantil
si
20 45 65
Obesidad infantil
no
70 26 96
90 71 161
65 personas con
obesidad infantil
96 personas sin
obesidad infantil
90 personas
pertenecen a
barriadas pobres
71 personas
pertenecen a
barriadas más
ricas
8. VI: barrio en el que vive, tiene 2 categorías: barrio rico o barrio
pobre COLUMNAS
VD: Obesidad infantil, tiene 2 categorías: si o no FILAS
Voy a calcular los datos esperados en una tabla a parte:
Grados de libertad: (2-1) x (2-1) = 1
Barrio pobre Barrio rico
Obesidad
infantil si
𝟗𝟎 𝑿 𝟔𝟓
𝟏𝟔𝟏
=36,3
𝟕𝟏 𝑿 𝟔𝟓
𝟏𝟔𝟏
=28,66
65
Obesidad
infantil no
𝟗𝟎 𝑿 𝟗𝟔
𝟏𝟔𝟏
=53,66
𝟗𝟔 𝑿 𝟕𝟏
𝟏𝟔𝟏
=42,3
96
90 71 161
9. Calculamos Chi-cuadrado:
(20 −36,3)2
36,3
+
(45 −28,66)2
28,66
+
(70 −53,66)2
53,66
+
(26 −42,3)2
42,3
= 27,9
- Miramos el valor de Chi-Cuadrado en la Tabla (1 grado de libertad y nivel de
significación 0,01)
10. Miramos la tabla. Para que p sea 0,01, Chi cuadrado tiene que valer: 6,64
27,9 es mucho mayor que este valor, por lo cual p es mucho menor que 0,01, lo que
significa que rechazamos la hipótesis nula.
Esto quiere decir que hay relación entre el barrio al que pertenece y el padecer o no
obesidad infantil.
Si rechazamos la hipótesis nula puede ser que haya mas obesos entre los niños
marginales o los no marginales. Tenemos que ver donde están los obesos.
- Obesidad barrios marginales :
𝟐𝟎
𝟗𝟎
= 0,22
- Obesidad barrios no marginales:
𝟒𝟓
𝟕𝟏
= 0.63
Hay mas obesidad infantil en los barrios no marginales.
11. Ejercicio 2: Tenemos la siguiente tabla de contingencia que refleja
los datos de la asignatura de religión en centros escolares. ¿Influye
el tipo de colegio en la nota obtenida? Con un margen de error 0,05.
Insuficiente Suficiente o bien Notable Sobresaliente Total
Centro privado 6 14 17 9 46
Instituto 30 32 17 3 82
36 46 34 12 128
H0 = no influye el tipo de colegio en la nota obtenida.
Hacemos una tabla con los datos esperados:
Insuficiente Suficiente o bien Notable Sobresaliente Total
Centro privado 12,94 16,53 12,22 4,31 46
Instituto 23,06 29,47 21,78 7,69 82
30 46 34 12 128
12. VI: nota obtenida: 4 categorías
VD: tipo de colegio, 2 categorías
Grado de libertad: (4-1) x (2-1) = 3
- Calculamos el valor de Chi – cuadrado:
(6 - 12,94)2/12,94 + (30 – 23,06)2/23, 06 + (14 - 16,53)2/16,53 + (32 – 29,47)2/29,47 + (17 –
12,22)2/12,22 + (17 – 21,78)2/21,78 + (9 - 4,31)2/4,31 + (3 – 7,69)2/7,69 = 17,3
Miramos la tabla:
13. Para que el nivel de significación fuese 0,05, Chi-cuadrado
debería valer 7,82.
En nuestro caso Chi-cuadrado vale 17,3. Es mucho mayor, por lo
que la p<0,05
Rechazamos la hipótesis nula. Si influye el tipo de colegio en la
nota obtenida. ¿Dónde hay mas porcentaje de suspensos?.
Privado: 6/46 = 0,13
Publico: 30/82 = 0,36
Se suspende mucho mas en los centros públicos que en los
privados.
14. Ejercicio 3: En un grupo de enfermos que se quejaban de que no
dormían se les dio somníferos y placebos. Con los siguientes resultados.
Nivel de significación: 0,05
¿Es lo mismo tomar somníferos que placebos para dormir bien o mal
en este grupo de enfermos?
RESULTADO Chi-cuadrado = 2,5778
15. H0 = no hay relación entre tomar somníferos o placebos y dormir bien o mal.
V.I = tomar somníferos o placebos. 2 categorías
V.D = dormir bien o mal. 2 categorías
Hacemos una tabla con los datos observados:
Hacemos una tabla con los datos esperados:
Duerme bien Duerme mal
Somníferos 44 10 54
Placebos 81 35 116
125 45 170
Duerme bien Duerme mal
Somníferos 125 x 54/170 = 39,7 45 x 54/170 = 14,29 54
Placebos 125 x 116/170 = 85,29 45 x 116/170 = 30,70 116
125 45 170
16. - Grados de libertad : (2 – 1) x (2 – 1)= 1
Calculamos Chi-cuadrado:
(44 – 29,7)2/29,7 + (81 – 85,29)2/85,29 + (10 – 14,29)2/14,29 + (35 – 30,70)2/30,70 = 2,57
Buscamos el valor de Chi-cuadrado en la tabla (1 grado de libertad y un nivel de
significación de 0,05)
El valor de Chi-
cuadrado para que p
= 0,05 es 3,84. 2,57 es
menor que este valor.
Por lo que la p>0,05.
Así que aceptamos la
hipótesis nula:
No hay relación entre
tomar somníferos o
placebos y dormir bien o
mal.
17. Ejercicio 4: En un C de Salud analizamos las historias de
enfermería (292 hombres y 192 mujeres). De ellos tienen úlcera 10
hombres y 24 mujeres y no tienen 282 y 168 respectivamente.
Nivel significación 0,05
H0 = no influye el sexo en el hecho de tener o no tener úlceras.
Hacemos una tabla con los datos observados:
- V.I = sexo. Tiene 2 categorías (mujer, hombre).
- V.D = presencia de úlceras. Tiene 2 categorías (si tiene, no tiene).
Tienen úlcera No tienen úlcera
Mujer 24 168 192
Hombre 10 282 292
34 450 484
18. Hacemos una tabla con los datos esperados:
- Grados de libertad: (2-1) x (2-1) = 1
- Nivel de significación = 0,05
Calculamos el valor de Chi-cuadrado:
(24 – 13,5)2/13,5 + (10 – 20,5)2/20,5 + (168 – 178,5)2/178,5 + (292 – 271,5)2/271,5 = 14,6
Tienen úlcera No tienen úlcera
Mujer 34 x 192/484 = 13,5 450 x 192/484 = 178,5 192
Hombre 34 x 292/484 = 20,5 450 x 292/484 = 271,5 292
34 450 484
19. Miramos en la tabla cuál sería el valor de Chi-cuadrado para que p = 0,05
Para que p = 0,05, Chi-cuadrado tiene que valer 3,84. Nuestro valor es mucho mayor (14,6).
Por lo que la p será mucho menor de 0,05. Rechazamos la hipótesis nula.
Sí influye el sexo en el hecho de tener o no tener úlceras.
- Úlceras en hombres: 10/292 = 0,034 x 100 = 3,4%
- Úlceras en mujeres: 24/192 = 0,125 x 100 = 12,5%
LAS ÚLCERAS APARECEN MÁS EN MUJERES QUE EN HOMBRES.