SlideShare una empresa de Scribd logo
1 de 32
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
Punto 3
Punto 4
TEMA 8TEMA 8
Análisis inferencial de datos categóricos
Estadística
INGENIERÍA MULTIMEDIA
Violeta Migallón
Punto 2
Punto 3
Punto 4
Punto 1
Introducción
Contrastes de homogeneidad y
contingencia
El test de bondad de ajuste Ji-cuadrado
Actividades prácticas
Punto 1
Punto 2
Punto 3
Punto 4
TEMA 8TEMA 8
Análisis inferencial de datos categóricos
Punto 2
Punto 3
Punto 4
Punto 1
Test Ji-cuadrado de homogeneidad
Test Ji-cuadrado de contingencia
Test de bondad de ajuste Ji-cuadrado
Punto 1
TEMA 8TEMA 8
Introducción
Punto 2
Punto 3
Punto 4
Punto 1
Contrastes de homogeneidad
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1
Contrastes de contingencia
(independencia)
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1
Tabla de doble entrada: Forma de
presentar las frecuencias observadas
conjuntas de las variables que aparecen
en el problema
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Ejemplo para ilustrar los conceptos del tema
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo: En un estudio del sistema de justicia juvenil de una
ciudad se formuló la hipótesis de que las chicas recibían un
tratamiento más suave que los chicos. De los ficheros de la ciudad
se seleccionaron al azar los registros de 152 casos de chicos y 156
casos de chicas y se clasificó la disposición de cada caso en orden
creciente de severidad como (1) aconsejados y librados, (2) una
intervención del departamento de libertad vigilada, (3) dos o más
intervenciones y (4) envío al tribunal juvenil. Los datos están en
la siguiente tabla de doble entrada:
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1
H0: El sistema judicial juvenil se comporta de
forma homogénea (análoga) con los chicos y
con las chicas
H1: No H0
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1
Notación:
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
θij=frecuencia observada en la celda correspondiente a la
fila i-ésima y a la columna j-ésima
Ri=total fila i
Cj=total columna j
r=número de filas
c=número de columnas
θ31=18
R2=76
C1=152
r=4
c=2
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Frecuencias esperadas:
Eij= frecuencia absoluta esperada para la fila i y
columna j si H0 es cierta
Punto 1
Punto 2
Ri=total fila i
Cj=total columna j
T=tamaño de la muestra
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
E32=(R3·C2)/T=
(25*156)/308=12.7
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Contraste de hipótesis con el estadístico Ji-
cuadradoPunto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
El SPSS obtiene dicho valor de
χ2
0
sin tener que hacer nosotros
los cálculos
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Contraste de hipótesis con el estadístico Ji-
cuadrado
En el ejemplo anterior para un nivel de significación
α=0.05, se obtiene:
χ2
0
=30.952≥χ2
0.05,3
=IDF.CHISQ(0.95,3)=7.81,
por tanto se debe rechazar la hipótesis de
homogeneidad en el tratamiento del sistema judicial
juvenil con los chicos y las chicas al 5 por ciento de
nivel de significación
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Contraste de hipótesis con el estadístico Ji-
cuadrado
Recordemos que, tal y como se ha explicado en
clase, en caso de no darnos el nivel de
significación, si el P-valor es pequeño rechazaremos la
hipótesis nula
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Contraste de hipótesis con el estadístico Ji-
cuadrado
Para el ejemplo,
P-valor=P(χ2
3
≥30.952)=1-CDF.CHISQ(30.952,3)=0,
es decir, para todo α mayor que 0 rechazaremos la
hipótesis nula, por lo que concluimos que el sistema
de justicia juvenil no se comporta de forma
homogénea con las chicas y con los chicos
El SPSS obtiene el P-valor
directamente, sin tener que
hacer nosotros los cálculos
Punto 2
Punto 3
Punto 4
Punto 1
Adecuación de la aproximación Ji-cuadrado:
Todas las frecuencias esperadas mayores o igual que 1
Al menos un 20 por ciento de las celdas con frecuencia
esperada mayor o igual que 5
Combinar categorías
Olvidar parte de la
información
En caso contrario
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Estudio de las celdas de interés:
El SPSS obtiene los Zij
directamente, sin tener que
hacer nosotros los cálculos
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Estudio de las celdas de interés: (Ejemplo)
Las diferencias
interesantes vienen
marcadas por @
seguidas de las
marcadas por O. En
caso de no existir
ningún símbolo del
tipo @, se
analizarán las del
tipo O. Además
habrá que analizar
el signo de los Zij
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Estudio de las celdas de interés: (Ejemplo)
Observamos en la tabla que las celdas de mayor interés
(las marcadas con @ y O) son las correspondientes a
envíos al tribunal juvenil y la de aconsejados y librados
 En el primer caso se observa un número significativamente
mayor de personas que son chicos y enviados al tribunal juvenil de
lo que cabría esperar si el sistema judicial se comportara de forma
homogénea con los chicos y con las chicas. Mientras que se
observa un número significativamente menor de personas que son
chicas y enviadas al tribunal juvenil de lo que cabría esperar si el
sistema judicial se comportara de forma homogénea con los chicos
y con las chicas
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Estudio de las celdas de interés: (Ejemplo)
 Por otra parte en las categorías de aconsejados y librados se
observa un número significativamente mayor de personas que son
chicas y aconsejadas y libradas de lo que cabría esperar si el
sistema judicial se comportara de forma homogénea con los chicos
y con las chicas. Mientras que se observa un número
significativamente menor de personas que son chicos y
aconsejados y librados de lo que cabría esperar si el sistema
judicial se comportara de forma homogénea con los chicos y con
las chicas
 De todo ello, se deduce que se ha tratado de forma más
dura a los chicos
Punto 2
Punto 3
Punto 4
Punto 1
H0: la muestra procede de la población
especificada
H1: no H0
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
i=1
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo: Un periódico nacional publicó un estudio que indicaba
que el desglose de clientes de centros comerciales según su edad
en una ciudad grande en porcentajes era:
A una muestra aleatoria de clientes de unos grandes almacenes,
se le pidió que indicara su categoría de edad. Y se obtuvo la
siguiente distribución de frecuencias observadas:
Queremos saber si las edades encontradas por el centro comercial
se corresponden con la distribución de edades publicadas por el
periódico a un nivel de significación del 1 por ciento
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo (continuación):
p1
=proporción poblacional de clientes de centros comerciales
menores de 21 años
p2
=proporción poblacional de clientes de centros comerciales con
edad entre 21 y 35 años
p3
=proporción poblacional de clientes de centros comerciales con
edad entre 36 y 55 años
p4
=proporción poblacional de clientes de centros comerciales con
edad entre 56 y 65 años
p5
=proporción poblacional de clientes de centros comerciales de
edad mayor o igual a 66
El contraste de hipótesis es el siguiente:
H0
: p1
=0.10, p2
=0.32, p3
=0.31, p4
=0.16, p5
=0.11
H1
: Las proporciones de la población no son p1
=0.10,
p2
=0.32, p3
=0.31, p4
=0.16, p5
=0.11
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo (continuación):
El contraste de hipótesis es el siguiente:
H0
: p1
=0.10, p2
=0.32, p3
=0.31, p4
=0.16, p5
=0.11
H1
: Las proporciones de la población no son p1
=0.10,
p2
=0.32, p3
=0.31, p4
=0.16, p5
=0.11
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
θ1=18, θ2=51, θ3=42, θ4=89, θ5=50,
E1=0.10·250=25, E2=0.32·250=80,
E3=0.31·250=77.5, E4=0.16·250=40, E5=0.11·250=27.5
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Ejemplo (continuación):
El SPSS obtiene dicho valor de
χ2
0
sin tener que hacer nosotros
los cálculos
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo (continuación):
Entonces:
χ2
0
=107.1679
Por otro lado, a un nivel de significación α=0.01, se tiene:
χ2
0.01, 4
=IDF.CHISQ(0.99,4)=13.28
Por tanto como χ2
0
es mayor o igual que χ2
0.01, 4
se rechaza la
hipótesis nula, lo que significa que, con un nivel de significación del
1 por ciento, los clientes de ese gran almacén no se ajustan a la
distribución de edades de la gran ciudad publicada por el periódico
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo (continuación):
Resolución mediante el cálculo del P-valor:
χ2
0
=107.1679
Entonces P-valor=P(χ2
4
≥107.1679)=1-CDF.CHISQ(107.1679,4)=0
Por tanto para todo α mayor que 0 (y en particular para α=0.01), se
rechaza la hipótesis nula, lo que significa que los clientes de ese
gran almacén no se ajustan a la distribución de edades de la gran
ciudad publicada por el periódico
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
El SPSS obtiene el P-valor
directamente, sin tener que
hacer nosotros los cálculos
Punto 2
Punto 3
Punto 4
Punto 1 Estudio de las celdas de interés: En un test de bondad
de ajuste Ji-cuadrado es interesante estudiar también qué
casillas han contribuido en mayor medida a esto. Veamos
cómo:
Se calculan los residuos tipificados:
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Punto 2
Punto 3
Punto 4
Punto 1
Estudio de las celdas de interés: Las diferencias
interesantes vienen marcadas por @ seguidas de las
marcadas por O. En caso de no existir ningún símbolo del
tipo @, se analizarán las del tipo O.
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Ejemplo (continuación):
i θi
Ei
Zi
Símbolo
Menor de 21 años 1 18 25 -1.4 .
21-35 2 51 80 -3.24 @
36-55 3 42 77.5 -4.03 @
56-65 4 89 40 7.75 @
Mayor o igual a 66 años 5 50 27.5 4.29 @
Estudio de las celdas de interés: Las diferencias
interesantes vienen marcadas por @ seguidas de las
marcadas por O. En caso de no existir ningún símbolo del
tipo @, se analizarán las del tipo O.
Estudio de las celdas de interés: Las diferencias
interesantes vienen marcadas por @ seguidas de las
marcadas por O. En caso de no existir ningún símbolo del
tipo @, se analizarán las del tipo O
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Ejemplo (continuación):
Se deduce que se han observado menos clientes con
edades comprendidas entre 21 y 55 años de los que cabría
esperar si este gran almacén hubiera seguido la
distribución publicada por el periódico y más clientes con
edad mayor o igual a 56 años de lo que cabría esperar si
este gran almacén hubiera seguido la distribución
publicada por el periódico
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Actividades prácticas
Punto 1
Punto 2
Punto 3
Punto 4
HACED LAS ACTIVIDADES
PROPUESTAS PARA ESTE TEMA

Más contenido relacionado

La actualidad más candente

La actualidad más candente (14)

Tarea. estadística inferencial
Tarea. estadística inferencialTarea. estadística inferencial
Tarea. estadística inferencial
 
Pruebas no parametricas de wilcoxon 2007.
Pruebas no parametricas de wilcoxon 2007.Pruebas no parametricas de wilcoxon 2007.
Pruebas no parametricas de wilcoxon 2007.
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
Pruebas de Uniformidad
Pruebas de UniformidadPruebas de Uniformidad
Pruebas de Uniformidad
 
Tarea 7
Tarea 7Tarea 7
Tarea 7
 
Datos por rango u37
Datos por rango u37Datos por rango u37
Datos por rango u37
 
Deber chi cuadrado (2)
Deber chi cuadrado (2)Deber chi cuadrado (2)
Deber chi cuadrado (2)
 
Estadística
EstadísticaEstadística
Estadística
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
Infe2
Infe2Infe2
Infe2
 
Prueba de los signos
Prueba de los signosPrueba de los signos
Prueba de los signos
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
SIMULACION UNIDAD II
SIMULACION UNIDAD IISIMULACION UNIDAD II
SIMULACION UNIDAD II
 
Seminario 8. Test de Chi - cuadrado.
Seminario 8. Test de Chi - cuadrado.Seminario 8. Test de Chi - cuadrado.
Seminario 8. Test de Chi - cuadrado.
 

Similar a Análisis inferencial de datos categóricos

Similar a Análisis inferencial de datos categóricos (20)

Tema12 ud5
Tema12 ud5Tema12 ud5
Tema12 ud5
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS
SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS
SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS
 
Distribuciones de frecuencia cuarto semestre
Distribuciones de frecuencia cuarto semestreDistribuciones de frecuencia cuarto semestre
Distribuciones de frecuencia cuarto semestre
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango
Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rangoCapítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango
Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango
 
Taller de estadistica
Taller de estadisticaTaller de estadistica
Taller de estadistica
 
Deber 1.pdf
Deber 1.pdfDeber 1.pdf
Deber 1.pdf
 
Chi Cuadrado
Chi CuadradoChi Cuadrado
Chi Cuadrado
 
Tarea chi cuadrado
Tarea chi cuadradoTarea chi cuadrado
Tarea chi cuadrado
 
1DATOS NO AGRUPADOS ESATADISTICA 1
1DATOS NO AGRUPADOS ESATADISTICA 11DATOS NO AGRUPADOS ESATADISTICA 1
1DATOS NO AGRUPADOS ESATADISTICA 1
 
ANOVA.ppt
ANOVA.pptANOVA.ppt
ANOVA.ppt
 
Organizacion de datos lv
Organizacion de datos lvOrganizacion de datos lv
Organizacion de datos lv
 
Estadística inferencial
Estadística inferencialEstadística inferencial
Estadística inferencial
 
Prueba no paramétrica- Wilcoxon
Prueba no paramétrica- WilcoxonPrueba no paramétrica- Wilcoxon
Prueba no paramétrica- Wilcoxon
 
F 07 probabilidad
F 07 probabilidadF 07 probabilidad
F 07 probabilidad
 
Clase 02
Clase 02Clase 02
Clase 02
 
MATEMÁTICA - 5TO GRADO - UNIDAD 10.pdf
MATEMÁTICA - 5TO GRADO - UNIDAD 10.pdfMATEMÁTICA - 5TO GRADO - UNIDAD 10.pdf
MATEMÁTICA - 5TO GRADO - UNIDAD 10.pdf
 
ClasesProbEst4.ppt estadistica para princi
ClasesProbEst4.ppt estadistica para princiClasesProbEst4.ppt estadistica para princi
ClasesProbEst4.ppt estadistica para princi
 

Más de Violeta Migallón

Cuatro ejercicios de probabilidad
Cuatro ejercicios de probabilidadCuatro ejercicios de probabilidad
Cuatro ejercicios de probabilidadVioleta Migallón
 
Modelos de distribución discretos y continuos
Modelos de distribución discretos y continuosModelos de distribución discretos y continuos
Modelos de distribución discretos y continuosVioleta Migallón
 
Nuevas tecnologías y perspectiva de género
Nuevas tecnologías y perspectiva de géneroNuevas tecnologías y perspectiva de género
Nuevas tecnologías y perspectiva de géneroVioleta Migallón
 
Cálculo de probabilidades y análisis combinatorio
Cálculo de probabilidades y análisis combinatorioCálculo de probabilidades y análisis combinatorio
Cálculo de probabilidades y análisis combinatorioVioleta Migallón
 

Más de Violeta Migallón (6)

Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 
Cuatro ejercicios de probabilidad
Cuatro ejercicios de probabilidadCuatro ejercicios de probabilidad
Cuatro ejercicios de probabilidad
 
Modelos de distribución discretos y continuos
Modelos de distribución discretos y continuosModelos de distribución discretos y continuos
Modelos de distribución discretos y continuos
 
Nuevas tecnologías y perspectiva de género
Nuevas tecnologías y perspectiva de géneroNuevas tecnologías y perspectiva de género
Nuevas tecnologías y perspectiva de género
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Cálculo de probabilidades y análisis combinatorio
Cálculo de probabilidades y análisis combinatorioCálculo de probabilidades y análisis combinatorio
Cálculo de probabilidades y análisis combinatorio
 

Último

Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfapunteshistoriamarmo
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesMarisolMartinez707897
 
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSSEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSYadi Campos
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024IES Vicent Andres Estelles
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOluismii249
 
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIASISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIAFabiolaGarcia751855
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024IES Vicent Andres Estelles
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICAÁngel Encinas
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Katherine Concepcion Gonzalez
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfMercedes Gonzalez
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Juan Martín Martín
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOluismii249
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxiemerc2024
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptxdeimerhdz21
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.JonathanCovena1
 

Último (20)

Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSSEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
 
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIASISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 

Análisis inferencial de datos categóricos

  • 1. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 Punto 3 Punto 4 TEMA 8TEMA 8 Análisis inferencial de datos categóricos Estadística INGENIERÍA MULTIMEDIA Violeta Migallón
  • 2. Punto 2 Punto 3 Punto 4 Punto 1 Introducción Contrastes de homogeneidad y contingencia El test de bondad de ajuste Ji-cuadrado Actividades prácticas Punto 1 Punto 2 Punto 3 Punto 4 TEMA 8TEMA 8 Análisis inferencial de datos categóricos
  • 3. Punto 2 Punto 3 Punto 4 Punto 1 Test Ji-cuadrado de homogeneidad Test Ji-cuadrado de contingencia Test de bondad de ajuste Ji-cuadrado Punto 1 TEMA 8TEMA 8 Introducción
  • 4. Punto 2 Punto 3 Punto 4 Punto 1 Contrastes de homogeneidad TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 5. Punto 2 Punto 3 Punto 4 Punto 1 Contrastes de contingencia (independencia) TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 6. Punto 2 Punto 3 Punto 4 Punto 1 Tabla de doble entrada: Forma de presentar las frecuencias observadas conjuntas de las variables que aparecen en el problema TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 Ejemplo para ilustrar los conceptos del tema
  • 7. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo: En un estudio del sistema de justicia juvenil de una ciudad se formuló la hipótesis de que las chicas recibían un tratamiento más suave que los chicos. De los ficheros de la ciudad se seleccionaron al azar los registros de 152 casos de chicos y 156 casos de chicas y se clasificó la disposición de cada caso en orden creciente de severidad como (1) aconsejados y librados, (2) una intervención del departamento de libertad vigilada, (3) dos o más intervenciones y (4) envío al tribunal juvenil. Los datos están en la siguiente tabla de doble entrada: TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 8. Punto 2 Punto 3 Punto 4 Punto 1 H0: El sistema judicial juvenil se comporta de forma homogénea (análoga) con los chicos y con las chicas H1: No H0 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 9. Punto 2 Punto 3 Punto 4 Punto 1 Notación: TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 θij=frecuencia observada en la celda correspondiente a la fila i-ésima y a la columna j-ésima Ri=total fila i Cj=total columna j r=número de filas c=número de columnas θ31=18 R2=76 C1=152 r=4 c=2
  • 10. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Frecuencias esperadas: Eij= frecuencia absoluta esperada para la fila i y columna j si H0 es cierta Punto 1 Punto 2 Ri=total fila i Cj=total columna j T=tamaño de la muestra
  • 11. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 E32=(R3·C2)/T= (25*156)/308=12.7
  • 12. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Contraste de hipótesis con el estadístico Ji- cuadradoPunto 1 Punto 2
  • 13. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia El SPSS obtiene dicho valor de χ2 0 sin tener que hacer nosotros los cálculos
  • 14. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Contraste de hipótesis con el estadístico Ji- cuadrado En el ejemplo anterior para un nivel de significación α=0.05, se obtiene: χ2 0 =30.952≥χ2 0.05,3 =IDF.CHISQ(0.95,3)=7.81, por tanto se debe rechazar la hipótesis de homogeneidad en el tratamiento del sistema judicial juvenil con los chicos y las chicas al 5 por ciento de nivel de significación
  • 15. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Contraste de hipótesis con el estadístico Ji- cuadrado Recordemos que, tal y como se ha explicado en clase, en caso de no darnos el nivel de significación, si el P-valor es pequeño rechazaremos la hipótesis nula
  • 16. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Contraste de hipótesis con el estadístico Ji- cuadrado Para el ejemplo, P-valor=P(χ2 3 ≥30.952)=1-CDF.CHISQ(30.952,3)=0, es decir, para todo α mayor que 0 rechazaremos la hipótesis nula, por lo que concluimos que el sistema de justicia juvenil no se comporta de forma homogénea con las chicas y con los chicos El SPSS obtiene el P-valor directamente, sin tener que hacer nosotros los cálculos
  • 17. Punto 2 Punto 3 Punto 4 Punto 1 Adecuación de la aproximación Ji-cuadrado: Todas las frecuencias esperadas mayores o igual que 1 Al menos un 20 por ciento de las celdas con frecuencia esperada mayor o igual que 5 Combinar categorías Olvidar parte de la información En caso contrario TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 18. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Estudio de las celdas de interés: El SPSS obtiene los Zij directamente, sin tener que hacer nosotros los cálculos
  • 19. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 Estudio de las celdas de interés: (Ejemplo) Las diferencias interesantes vienen marcadas por @ seguidas de las marcadas por O. En caso de no existir ningún símbolo del tipo @, se analizarán las del tipo O. Además habrá que analizar el signo de los Zij
  • 20. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 Estudio de las celdas de interés: (Ejemplo) Observamos en la tabla que las celdas de mayor interés (las marcadas con @ y O) son las correspondientes a envíos al tribunal juvenil y la de aconsejados y librados  En el primer caso se observa un número significativamente mayor de personas que son chicos y enviados al tribunal juvenil de lo que cabría esperar si el sistema judicial se comportara de forma homogénea con los chicos y con las chicas. Mientras que se observa un número significativamente menor de personas que son chicas y enviadas al tribunal juvenil de lo que cabría esperar si el sistema judicial se comportara de forma homogénea con los chicos y con las chicas
  • 21. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 Estudio de las celdas de interés: (Ejemplo)  Por otra parte en las categorías de aconsejados y librados se observa un número significativamente mayor de personas que son chicas y aconsejadas y libradas de lo que cabría esperar si el sistema judicial se comportara de forma homogénea con los chicos y con las chicas. Mientras que se observa un número significativamente menor de personas que son chicos y aconsejados y librados de lo que cabría esperar si el sistema judicial se comportara de forma homogénea con los chicos y con las chicas  De todo ello, se deduce que se ha tratado de forma más dura a los chicos
  • 22. Punto 2 Punto 3 Punto 4 Punto 1 H0: la muestra procede de la población especificada H1: no H0 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 i=1
  • 23. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo: Un periódico nacional publicó un estudio que indicaba que el desglose de clientes de centros comerciales según su edad en una ciudad grande en porcentajes era: A una muestra aleatoria de clientes de unos grandes almacenes, se le pidió que indicara su categoría de edad. Y se obtuvo la siguiente distribución de frecuencias observadas: Queremos saber si las edades encontradas por el centro comercial se corresponden con la distribución de edades publicadas por el periódico a un nivel de significación del 1 por ciento TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3
  • 24. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo (continuación): p1 =proporción poblacional de clientes de centros comerciales menores de 21 años p2 =proporción poblacional de clientes de centros comerciales con edad entre 21 y 35 años p3 =proporción poblacional de clientes de centros comerciales con edad entre 36 y 55 años p4 =proporción poblacional de clientes de centros comerciales con edad entre 56 y 65 años p5 =proporción poblacional de clientes de centros comerciales de edad mayor o igual a 66 El contraste de hipótesis es el siguiente: H0 : p1 =0.10, p2 =0.32, p3 =0.31, p4 =0.16, p5 =0.11 H1 : Las proporciones de la población no son p1 =0.10, p2 =0.32, p3 =0.31, p4 =0.16, p5 =0.11 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3
  • 25. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo (continuación): El contraste de hipótesis es el siguiente: H0 : p1 =0.10, p2 =0.32, p3 =0.31, p4 =0.16, p5 =0.11 H1 : Las proporciones de la población no son p1 =0.10, p2 =0.32, p3 =0.31, p4 =0.16, p5 =0.11 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 θ1=18, θ2=51, θ3=42, θ4=89, θ5=50, E1=0.10·250=25, E2=0.32·250=80, E3=0.31·250=77.5, E4=0.16·250=40, E5=0.11·250=27.5
  • 26. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 Ejemplo (continuación): El SPSS obtiene dicho valor de χ2 0 sin tener que hacer nosotros los cálculos
  • 27. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo (continuación): Entonces: χ2 0 =107.1679 Por otro lado, a un nivel de significación α=0.01, se tiene: χ2 0.01, 4 =IDF.CHISQ(0.99,4)=13.28 Por tanto como χ2 0 es mayor o igual que χ2 0.01, 4 se rechaza la hipótesis nula, lo que significa que, con un nivel de significación del 1 por ciento, los clientes de ese gran almacén no se ajustan a la distribución de edades de la gran ciudad publicada por el periódico TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3
  • 28. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo (continuación): Resolución mediante el cálculo del P-valor: χ2 0 =107.1679 Entonces P-valor=P(χ2 4 ≥107.1679)=1-CDF.CHISQ(107.1679,4)=0 Por tanto para todo α mayor que 0 (y en particular para α=0.01), se rechaza la hipótesis nula, lo que significa que los clientes de ese gran almacén no se ajustan a la distribución de edades de la gran ciudad publicada por el periódico TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 El SPSS obtiene el P-valor directamente, sin tener que hacer nosotros los cálculos
  • 29. Punto 2 Punto 3 Punto 4 Punto 1 Estudio de las celdas de interés: En un test de bondad de ajuste Ji-cuadrado es interesante estudiar también qué casillas han contribuido en mayor medida a esto. Veamos cómo: Se calculan los residuos tipificados: TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3
  • 30. Punto 2 Punto 3 Punto 4 Punto 1 Estudio de las celdas de interés: Las diferencias interesantes vienen marcadas por @ seguidas de las marcadas por O. En caso de no existir ningún símbolo del tipo @, se analizarán las del tipo O. TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 Ejemplo (continuación): i θi Ei Zi Símbolo Menor de 21 años 1 18 25 -1.4 . 21-35 2 51 80 -3.24 @ 36-55 3 42 77.5 -4.03 @ 56-65 4 89 40 7.75 @ Mayor o igual a 66 años 5 50 27.5 4.29 @ Estudio de las celdas de interés: Las diferencias interesantes vienen marcadas por @ seguidas de las marcadas por O. En caso de no existir ningún símbolo del tipo @, se analizarán las del tipo O. Estudio de las celdas de interés: Las diferencias interesantes vienen marcadas por @ seguidas de las marcadas por O. En caso de no existir ningún símbolo del tipo @, se analizarán las del tipo O
  • 31. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 Ejemplo (continuación): Se deduce que se han observado menos clientes con edades comprendidas entre 21 y 55 años de los que cabría esperar si este gran almacén hubiera seguido la distribución publicada por el periódico y más clientes con edad mayor o igual a 56 años de lo que cabría esperar si este gran almacén hubiera seguido la distribución publicada por el periódico
  • 32. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Actividades prácticas Punto 1 Punto 2 Punto 3 Punto 4 HACED LAS ACTIVIDADES PROPUESTAS PARA ESTE TEMA