1. Instituto Universitario Politécnico
“Santiago Mariño”
Extensión Caracas
Ingeniera Civil 42 A
Coeficientes de correlación de Pearson y de Sperman
Autor:
Palencia John.CI:
24.991.633
Asignatura: Estadística
Profesora:
María Romano
2. Coeficiente de Pearson
Es un índice que mide el grado de covariación entre distintas variables relacionadas linealmente.
Adviértase que decimos "variables relacionadas linealmente". Esto significa que puede haber variables
fuertemente relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la correlación de
Pearson.
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el coeficiente
de correlación de Pearson se simboliza con la letra P x y siendo la expresión que nos permite calcularlo:
3. Uso de los coeficientes de correlación de
Pearson
Identifica el dependiente variable que se probará entre dos observaciones derivadas
independientemente. Uno de los requisitos es que las dos variables que se comparan deben observarse
o medirse de manera independiente para eliminar cualquier resultado sesgado.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las
dos variables.
Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva
entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información.
Para cantidades grandes de información, el cálculo puede ser tedioso.
4. Karl Pearson
Karl Pearson (Londres 27 de marzo de 1857- Londres, 27 de abril de 1936) fue un prominente científico,
matemático y pensador británico, que estableció la disciplina de la estadística matemática. Desarrolló una
intensa investigación sobre la aplicación de los métodos estadísticos en la biología y fue el fundador de
la bioestadística.
5. Ejemplo Coeficiente de Pearson
La gráfica (a) representa una correlación positiva, es decir, conforme los valores de X aumentan,
también aumentan los valores de Y.
(b) muestra una correlación negativa, de modo que al incrementarse los valores de la variable
independiente, los valores de la dependiente disminuyen.
(c) no indica correlación.
6. Ejemplo Coeficiente de Pearson
Dónde:
r = coeficiente de correlación de Pearson.
Sxy = sumatoria de los productos de ambas variables.
Sx = sumatoria de los valores de la variable independiente.
Sy = sumatoria de los valores de la variable dependiente.
Sx2 = sumatoria de los valores al cuadrado de la variable independiente.
Sy2 = sumatoria de los valores al cuadrado de la variable dependiente.
N = tamaño de la muestra en función de parejas.
7. Ventajas Coeficiente de Pearson
Cuando en el fenómeno estudiado las dos variables son cuantitativas se usa el coeficiente de
correlaciones de Pearson.
Es llamado así en homenaje a Karl Pearson. Las dos variables son designadas por X e Y.
El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir
variables.
Mientras más grande sea la muestra más exacta será la estimación.
8. Desventajas Coeficiente de Pearson
El valor 0 representa falta de correlación.
Cuando las variables X e Y son independientes, el numerador se anula y el coeficiente de correlación
poblacional tiene el valor cero.
En cambio una correlación nula no implica la independencia de variables.
Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.
Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la
distribución de ambas sea semejante a la de la curva normal.
9. Coeficiente de Correlación Spearman
La correlación de Spearman es una medida de relación lineal entre dos variables. Se diferencia de la
correlación de Pearson en que utiliza valores medidos a nivel de una escala ordinal. Si alguna de las
variables está medida a nivel de escala de intervalo/razón deberá procederse antes de operar el
estadístico a su conversión en forma ordinal.
El estadístico ρ viene dado por la expresión:
10. Uso de Coeficiente de Correlación
Spearman
Permite predecir el valor de una variable dado un valor determinado de la otra variable.
Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como
correlación.
Dicho cálculo es el primer paso para determinar la relación entre las variables.
Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de
estimación.
Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación lineal positiva
entre las 2 variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación
positiva entre la información.
11. Charles Edward Spearman
Charles Edward Spearman (Londres, 10 de septiembre de 1863-Londres, 7 de septiembre de 1945) fue
un psicólogo inglés. Estudió en las universidades de Leipzig, Wurzburgo y Göttingen y enseñó e investigó
en la Universidad de Londres (1907 - 1931). Formuló la teoría de que la inteligencia se compone de un
factor general y otros específicos. Creyó en la existencia de un factor general que interviene en todas las
fases de la conducta humana y atribuyó a las capacidades específicas papel determinante en cada
actividad.
12. Ventajas Coeficiente de Correlación
Spearman
No está afectada por los cambios en las unidades de medida.
Al ser Spearman una técnica no paramétrica es libre de distribución probabilística (2, 5, 9).
Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos
desvíos del patrón normal).
La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la
relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una
fuerte correlación (1, 5).
No se asume relación lineal entre las variables.
13. Desventajas Coeficiente de Correlación
Spearman
Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.
Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la
distribución de ambas sea semejante a la de la curva normal.
El valor 0 representa falta de correlación.
Cuando las variables X e Y son independientes, el numerador se anula y el coeficiente de correlación
poblacional tiene el valor cero.
En cambio una correlación nula no implica la independencia de variables.
14. Ejemplo Coeficiente de Correlación
Spearman
El tamaño de la muestra influye que durante el ordenamiento en rangos puedan existir ligas o empates.
Para estos casos, los pasos son los mismos, pero la fórmula no es aplicable. Las ecuaciones que se
deben utilizar en esta condición son las siguientes:
Dónde:
rs = coeficiente de correlación de Spearman.
SX2 = sumatoria de los cuadrados de la variable independiente.
15. Ejemplo Coeficiente de Correlación
Spearman
Dónde:
N = tamaño de la muestra.
SLx = sumatoria de las ligas o empates de la variable independiente.
Dónde:
Li = valor del número de rangos empatados.