4. TRATAMIENTOS ESTADÍSTICOS
FASE I FASE II
TRIANGULACIÓN
Cualitativa, exploratoria, Metodológica Cuantitativa, descriptiva,
preliminar concluyente
INFORMACIÓN + DATOS
TÉCNICAS BIVARIANTES TÉCNICAS MULTIVARIANTES TÉCNICAS DE CLASIFICACIÓN
Tablas de contingencia, Análisis factorial y
correlación lineal y análisis de regresión AID, CHAID y CART
análisis de varianza múltiple
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
5. CODIFICACIÓN Y ANÁLISIS BÁSICO
DE DATOS
Codificación y explotación de datos.
Tablas de frecuencias.
Tablas de contingencia.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
6. BIBLIOGRAFÍA
Autores: Autor: Autor: Autor:
ILDEFONSO GRANDE ESTEBAN Y John R. Webb Naresh K. Malhotra William G. Zikmund
ELENA ABASCAL FERNÁNDEZ
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
7. LA CODIFICACIÓN
CUANDO UNA VARIABLE ES MÉTRICA (edad en años), SE PUEDE CONVERTIR EN ORDINAL
Y EN NOMINAL (joven, adulto, mayor), PERO NO CABE LA POSIBILIDAD DE UNA
TRANSFORMACIÓN INVERSA. Finalmente tener presente que cuando una variable métrica
se convierte en nominal se pierde información, pero por el contrario permite el poder
analizarla simultáneamente con otras variables nominales, reduciéndose la influencia de
los valores extremos o raros.
EJEMPLO: (En una escala métrica el
código coincide con el valor de la
variable). La variable edad [ _ _ ] años,
que en este caso se trata de una
variable métrica, la podemos
transformar en los códigos: 1 = Edad
entre 20 y 30 años, un 2 = edad está
comprendida entre 31 y 40
años…………….
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
8. LA CODIFICACIÓN
LOS DATOS EN LOS SISTEMAS INFORMÁTICOS
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
9. LA CODIFICACIÓN
LOS DATOS EN LOS SISTEMAS INFORMÁTICOS
Lista de variables
BarbWin
Matriz de datos
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
10. LA CODIFICACIÓN
PROGRAMAR UNA PREGUNTA - VARIABLE
BarbWin
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
11. LA CODIFICACIÓN
La primera tarea que tenemos que realizar antes del análisis estadístico es la
creación de la MATRIZ DE DATOS, o sea, es la totalidad de la información
numérica generada por el trabajo de campo.
La matriz de datos se forma a partir del cruce de las variables con las unidades
de análisis (casos), tal y como podemos ver:
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
12. LA CODIFICACIÓN: ¿CUÁNDO SE RECODIFICAN LOS DATOS?
1. ERRORES EN EL CUESTIONARIO. Cuando se ha signado el código 0 para indicar que “SE
CONSUME” y 1 para indicar “NO SE CONSUME”, cuando debería ser al contrario.
2. MODIFICACIÓN DEL NÚMERO DE CATEGORÍAS. Cuando el número de categorías final pueda
facilitar más información, evitar dispersión, etc., en estos casos es preferible modificar la
codificación inicial.
3. CUANDO LA INFORMACIÓN ES CONTINUA e interesa agruparla en unas categorías para
cruzar variables (edad, renta, etc.).
4. CUANDO LAS CATEGORÍAS NO RECOGEN TODAS LAS POSIBILIDADES. Cuando una pregunta
queda abierta parcialmente. Lo que implica la generación de nuevas categorías que cubran
dichas respuestas facilitadas y no contempladas inicialmente.
5. CUANDO UNA CATEGORÍA TIENE UN RANGO ELEVADO DE OBSERVACIONES. En este caso
conveniente dividirla en varias para distribuir las respuestas (edad).
6. CUANDO UNA CATEGORÍA TIENE UNA PROPORCIÓN MUY PEQUEÑA DE OBSERVACIONES.
En este caso se procede a la agrupación de categorías similares con la finalidad de evitar la
dispersión de los datos.
7. CUANDO HAY QUE COMBINAR VARIABLES. Por ejemplo en el caso de que tengamos que
combinar las variables EDAD y SEXO (SEXEDAD), en la que el código 1 = Mujeres jóvenes (17 a
29 años)………………
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
13. VISIÓN GENERAL DE LAS TÉCNICAS DE
ANÁLISIS
¿Cuantas variables
van a analizarse a
la vez?
Una Dos Más de dos
Análisis Análisis Análisis
univariado bivariado de multivariado
de datos datos de datos
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
14. ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN
Las MEDIDAS DE TENDENCIA CENTRAL tienen como objetivo el sintetizar los datos en un
valor representativo, las MEDIDAS DE DISPERSIÓN nos dicen hasta que punto estas
medidas de tendencia central son representativas como síntesis de la información
(desviación típica, varianza, coeficiente de variación, etc.).
Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los
valores de la distribución respecto al valor central. En definitiva, las medidas de
dispersión nos indican si los valores se encuentran más o menos próximos a la
medida de posición y tendencia central.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
15. ESTADÍSTICAS BÁSICAS
Tipos de Escala Propiedades Operaciones estadísticas
NOMINAL Clasificación Frecuencias
Porcentajes
Moda
Tablas de Frecuencia
...
ORDINAL Clasificación Mediana
Ordenación Cuartiles
Correlación de orden
...
INTERVALO Clasificación Media aritmética
Ordenación Desviación típica
Interpretación de distancias Análisis de regresión
Análisis de varianza
...
RAZÓN O RATIO Clasificación Media armónica
Ordenación Media geométrica
Interpretación de distancias Coeficiente de variación
Interpretación de relaciones
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
16. ANÁLISIS DE LAS PREGUNTAS POR
SUBGRUPOS
HAY QUE ANALIZAR LAS PREGUNTAS EN LOS DISTINTOS SUBGRUPOS Y
COMPARARLAS ENTRE SÍ. (Comportamientos entre hombres y mujeres)
TABLAS DE CONTINGENCIA O TABLAS DE DOBLE ENTRADA
PARA EMPLEAR LAS TABLAS DE CONTINGENCIA DEBEN SEGUIRSE TRES REGLAS BÁSICAS:
1. Los datos pueden ser nominales, ordinales, de intervalos o métricas pero
deben convertirse en categorías.
2. El número de categorías debe ser limitado.
3. Es conveniente que el número de categorías debe ser tal que el cruce
tenga un número mínimo de frecuencias. De lo contrario, técnicas como
el test chi-cuadrado no funcionan.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
17. TABLAS DE CONTINGENCIA
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
18. TABLAS DE CONTINGENCIA
TABLAS DE CONTINGENCIA CON SPSS
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
19. TABLAS DE CONTINGENCIA
BarbWin
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
20. TABLAS DE CONTINGENCIA
Tabla de cont ingencia 2.3. ¿PODRÍA DECIRME CON QUÉ PROVEEDOR O PROVEEDORES TIENEN
CONTRATADO SU ACCESO A INTERNET EN EL HOGAR? * P3. ¿HA USADO INTERNET ALGUNA VEZ?
Recuento
P3. ¿HA USADO
INTERNET ALGUNA
VEZ?
Sí No Total
2.3. ¿PODRÍ A DECIRME ADSL de cualquier
CON QUÉ PROVEEDOR operador 71 16 87
O PROVEEDORES
Telev isión Local Cehegín 34 7 41
TIENEN CONTRATADO
SU ACCESO A Otro 5 0 5
INTERNET EN EL
HOGAR? NS/NC 2 6 8
Tabla de contingencia 2.3. ¿PODRÍA DECIRME CON QUÉ PROVEEDOR O PROVEEDORES TIENEN CONTRATADO SU
ACCESO A INTERNET EN EL HOGAR? * P3. ¿HA USADO INTERNET ALGUNA VEZ?
Total 112 29 141 P3. ¿HA USADO
INTERNET ALGUNA
VEZ?
Sí No Total
2.3. ¿PODRÍA DECIRME ADSL de cualquier Recuent o 71 16 87
CON QUÉ PROVEEDOR operador % de P3. ¿HA
O PROVEEDORES USADO INTERNET 63,4% 55,2% 61,7%
TIENEN CONTRATADO ALGUNA VEZ?
SU ACCESO A Telev isión Local Recuent o 34 7 41
INTERNET EN EL Cehegín % de P3. ¿HA
HOGAR?
USADO INTERNET 30,4% 24,1% 29,1%
ALGUNA VEZ?
Otro Recuent o 5 0 5
% de P3. ¿HA
USADO INTERNET 4,5% ,0% 3,5%
ALGUNA VEZ?
NS/NC Recuent o 2 6 8
% de P3. ¿HA
USADO INTERNET 1,8% 20,7% 5,7%
ALGUNA VEZ?
Total Recuent o 112 29 141
% de P3. ¿HA
USADO INTERNET 100,0% 100,0% 100,0%
ALGUNA VEZ?
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
21. TABLAS DE CONTINGENCIA
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
22. TABLAS DE CONTINGENCIA
COEFICIENTE DE CORRELACIÓN LINEAL
DE PEARSON
1. Mide el grado de asociación lineal entre dos variables métricas
2. Toma valores entre -1 y 1. Si es cercano a cero la asociación lineal es pequeña
3. Cuando dos variables se mueven en el mismo sentido (coeficiente positivo)
las variables están positivamente correlacionadas.
4. Cuando las variables se mueven en sentido contrario (coeficiente negativo)
las variables están negativamente correlacionadas.
5. No indica que variable es la que influye sobre la otra (para ello haría falta un
análisis causal o explicativo)
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
23. TABLAS DE CONTINGENCIA
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
NO correlacionan SÍ correlacionan
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
24. TÉCNICAS DE ANÁLISIS MULTIVARIANTE
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
25. TÉCNICAS DE ANÁLISIS MULTIVARIANTE
CLASIFICACIÓN SIMPLE DE LAS TÉCNICAS ESTADÍSTICAS MULTIVARIANTES
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
26. TÉCNICAS DE ANÁLISIS MULTIVARIANTE
CLASIFICACIÓN DE LAS TÉCNICAS DE ANÁLISIS DE LA INTERDEPENDENCIA
VARIABLES
MÉTRICAS NO MÉTRICAS
Análisis factorial.
Análisis de correspondencias.
Componentes principales.
Análisis de conglomerados.
Análisis de conglomerados.
Escalamiento multidimensional.
Escalamiento multidimensional.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
27. TÉCNICAS DE ANÁLISIS MULTIVARIANTE
Clasificación de los métodos de
análisis multivariante
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
28. REGRESIÓN LINEAL
RLS Y RLM
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
29. REGRESIÓN LINEAL
Objetivo:
Entender los aspectos teóricos del concepto de calidad de servicio, así como
interpretar los resultados de las técnicas estadísticas.
Metodología:
Regresión lineal múltiple.
Tenemos una variable dependiente o a explicar medida en escala métrica
(valoración global, por ejemplo) y un conjunto de atributos medidos también
en escala métrica.
Otras metodologías....
Análisis Factorial de Componentes Principales
Regresión por árbol de decisión binario
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
30. SALIDA DE UNA RLS
SOLUCIÓN:
El número de préstamos que cabe
esperar en caso de que el número
de usuarios aumente a 1500 es:
Prestamos = - 172 + 0.962 * 1500 =
1271
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
31. REGRESIÓN LINEAL
MÚLTIPLE
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
32. REGRESIÓN LINEAL MÚLTIPLE
LOS ESTADÍSTICOS Y TÉRMINOS RELACIONADOS CON ESTE ANÁLISIS SON:
1. Modelo de regresión de variables. La ecuación de regresión básica es
Y = B0 + B1 X1+ B2 X2 + B3 X3 + Bk Xk + ei
Donde Y es la variable dependiente, X es la variable independiente, B0 es la
intersección de la línea, Bn es la pendiente de la línea y ei es el término de
error.
1. Coeficiente de determinación (R2). La fuerza de la asociación se mide en el
coeficiente de determinación (R2 ). Varía entre 0 y 1 y representa la proporción
de la variación total en Y que se tiene en cuenta para la variación de X.
2. Coeficiente de regresión. Por lo general el parámetro B se conoce como
coeficiente de regresión no estandarizado.
3. Diagrama de dispersión. El diagrama de dispersión es un trazo de los valores
de dos variables para todos los casos u observaciones.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
33. REGRESIÓN LINEAL MÚLTIPLE
LOS ESTADÍSTICOS Y TÉRMINOS RELACIONADOS CON ESTE ANÁLISIS SON:
5. Error típico de la estimación. Este estadístico, SEE, es la desviación estándar
de los valores reales de Y a partir de los valores proyectados para Ŷ.
6. Coeficiente de regresión estandarizado. Se conoce también como coeficiente
Beta o valor relativo de beta y es la pendiente que se obtiene por la regresión
de Y en X cuando los datos son estandarizados.
7. Suma de errores cuadrados. Se obtiene el cuadrado de las distancias de todos
los puntos desde la línea de regresión y se suman para llegar a la suma de los
errores cuadrados, que constituyen una medida del error total.
8. Estadístico t. Un estadístico t con n-2 grados de libertad puede utilizarse para
probar la hipótesis nula de que no existe ninguna relación lineal entre X e Y o
H0: B1=0.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
34. REGRESIÓN LINEAL MÚLTIPLE
1
2
3
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
35. REGRESIÓN LINEAL MÚLTIPLE
SALIDA SPSS
2
1
3
4
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
36. REGRESIÓN LINEAL MÚLTIPLE
HIPÓTESIS NULA
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
37. ANÁLISIS DE LA VARIANZA
ANOVA
ANALYSIS OF VARIANCE
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
38. ANÁLISIS DE VARIANZA (ANOVA): CONCEPTO
El análisis de la varianza es un método explicativo que se utiliza para detectar la
existencia de una relación de dependencia entre dos o más variables. Una variable se
suele denominar variable dependiente o a explicar, y la otra, variable independiente o
explicativa.
En el análisis de la varianza el objetivo es determinar si el conjunto de variables
explicativas tienen o no una influencia significativa sobre la(s) variable(s) a explicar,
sin importar la intensidad de la relación. Por ello, se observa si los valores medios que
presentan la(s) variable(s) a explicar en cada grupo/categoría de la variable explicativa
son estadísticamente significativos.
Una de las aportaciones principales del análisis de la varianza se encuentra en la
segmentación de mercados. El análisis de la varianza se puede utilizar para detectar
diferencias entre diversos grupos, de tal manera que se puede contrastar el efecto de
una variable o variables determinadas sobre alguna(s) otra(s) variable(s) que
caracterizan diversos grupos de consumidores.
¿Cómo tienen que ser las variables que se tienen que medir? La variable(s) a
explicar (VD) es cuantitativa y la variable(s) explicativa (VI) es cualitativa.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
39. ANÁLISIS DE VARIANZA (ANOVA): CONCEPTO
1. Es una técnica estadística diseñada para medir si existen diferencias entre
los valores medios de una variable dependiente calculados para los distintos
grupos que se pueden obtener con otra variable independiente y nominal.
2. La variable o variables independientes reciben el nombre de Factor y deben
ser variables de tipo nominal, y sus distintos valores el de tratamientos,
mientras que la variable dependiente debe ser métrica, puesto que sobre
ella se debe calcular los valores medios objeto del análisis de la varianza.
3. La hipótesis nula a contrastar es que se consideran iguales las medias en
todos los grupos, o lo que es lo mismo, no existen diferencias entre las
medias obtenidas para cada uno de los grupos formados para la variable
independientes o factor.
4. Se rechaza la hipótesis nula con que al menos una de las medias sea
significativamente diferente de las demás.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
40. ANÁLISIS DE VARIANZA (ANOVA): CONDICIONES
1. La VD debe ser métrica o numérica.
2. La VI debe ser categórica.
3. Ningún sujeto debe estar en dos grupos de forma simultánea.
4. La varianza dentro de cada categoría debe ser parecida.
5. Las distribuciones deben ser normales.
6. Los grupos no tienen porque ser del mismo tamaño.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
41. EJEMPLO ANOVA FACTORIAL
2
1
3
4
VARIABLES DEL ARCHIVO EMPLEADOS:
(catlab) = Categoría laboral (ordinal)
(minoría) = Clasificación de minorías (ordinal)
(salario) = Salario actual (Métrica)
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
42. EJEMPLO ANOVA FACTORIAL
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
43. EJEMPLO ANOVA FACTORIAL
La tabla siguiente muestra el resultado obtenido con Scheffe. La conclusión a la
que se llega es que el grupo administrativo NO DIFIERE del grupo de agentes de
seguridad (Sig.=0,306), pero estos dos difieren significativamente del grupo
Directivos (Sig.=0,000).
Sig < 0,05 = Rechazaremos la hipótesis de igualdad de medias
Sig > 0,05 = Aceptamos la hipótesis de igualdad de medias.
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG
44. SALIDA SPSS DE ANOVA
MÁSTER SOCIOLOGÍA APLICADA
Análisis de datos y Triangulación
Francisco Hernández Gómez - @FranHernandezG