Seminario 8: Análisis bivariado con variables cuantitativas
1. Análisis bivariado con variables cuantitativas.
«normalidad y linealidad. Diagrama de dispersión.
Coeficientes de correlación de Pearson y Rho de
Spearman»
2. Determina si existe relación entre las
variables altura y peso del fichero de
datos “activos en salud” y si existe
determina cómo de fuerte es
Bien pues para ello lo primero vemos que tenemos dos variables y que ambas son
cuantitativas, luego descartamos todas las pruebas para cualitativas. Como ambas
son cuantitativas y podríamos utilizar T-Student, vamos a comprobar si siguen los
requisitos para hacer esta prueba
- Homocedasticidad
- Distribución normal
2 variables, independientes: Altura y peso
La normalidad la estudiaremos primero con gráficos para cada variable :
Por ejemplo Box plot, histograma, QQ
VAMOS A ELLO
EJERCICIO
3. Aparentemente no podemos
decir que sigan una
distribución normal, pero
vamos a ver más gráficos
Veamos nuestras variables
con el gráfico de diagrama
de cajas
4. Veamos con el gráfico de
comparación de cuartiles
(QQ)
Igualmente no podemos decir que
estas variables, a vista de estos gráficos
sigan una distribución normal, pero de
todas formas HAGAMOS EL TEST DE
SHAPIRO-WILKS
5. Vemos que el p-valor es
menor de 0.05---- luego
podemos aceptar la
hipótesis alternativa,
que nos dice que no
sigue una distribución
normal nuestra muestra
para esta variable.
Así que no tenemos que seguir con la otra variable por que han de cumplir las
dos los requisitos para el T-Student. ASI QUE VAMOS CON CORRELACIÓN.
6. Como son dos muestra
cuantitativas y no siguen
una distribución normal
realizaremos Rho de
Sperman .
Con ella conoceremos si
existe relación entre ambas y
como de fuerte es esta
relación.
Pero antes vamos a hacer un
diagrama de dispersión para
observar la posible correlación entre
variables
Podemos decir que existe
cierta relación entre
ambas variables
7. Bien pues estudiamos ya como de
fuerte es esta relación.
Lo podemos hacer con una matriz de
correlación
O bien con un test de correlación
8. RESULTADOS
Al tener un valor final en el test de 0.6224… y que por tanto esta próximo a 1
podemos decir…..
Que ambas variables poseen entre sí una relación bastante fuerte y buena
puesto que se acerca mucho al valor de 1 donde la correlación sería total, o la
máxima posible (mismo valores).
Y si analizamos el p valor, suponiendo
las variables posean homocedasticidad
podemos decir que es menor que 0.05 y
por tanto aceptaríamos la hipótesis alternativa
que implicaría aceptar que: LA ALTURA
INFLUYE EN EL PESO DE LOS INDIVIDUOS
DE LA MUESTRA