Este seminario trata sobre correlaciones entre variables cuantitativas. Explica cómo seleccionar dos variables de una base de datos, evaluar su distribución normal y realizar pruebas de correlación de Pearson o Spearman según corresponda. Finalmente, muestra que existe una correlación negativa entre el año de nacimiento y el número de cigarrillos fumados diariamente.
3. En primer lugar, escogemos dos variables de la
matriz de datos, en este caso año de nacimiento
y número de cigarrilos, ya que son variables
cuantitativas.
Posteriormente, con ayuda de SPSS, realizamos
la prueba de normalidad para saber que
estadístico de correlación debemos usar.
4.
5.
6. Al tratarse de una muestra menor a 50 debemos fijarnos
en el test de Shapiro-Wilk.
Y observamos que la significación para el año de
nacimiento es mayor que 0,05 por lo que decimos que no
es estadísticamente significativo y tiene una distribución
normal.
Mientras que para el número de cigarrillos es menor, es
estadísticamente significativo y por tanto, no tiene una
distribución normal.
7. A continuación, realizaremos las pruebas de
correlación.
Escogeríamos R de Pearson si sigue una
distribución normal y Rho de Spearman si no la
sigue.
Pero como en nuestro caso una variable si la
sigue y otra no, realizaremos ambas pruebas y
deberíamos obtener resultados similares.
8.
9.
10.
11. Obtenemos que existe una correlación negativa
entre la variable "Año de nacimiento" y "Número
de cigarrillos al día", es decir, el nacer en años
posteriores se relaciona con fumar menos
cigarrillos al día.
A continuación, representamos gráficamente los
resultados obtenidos.