1. TEMA 3:
Distribuciones
bidimensionales:
relación entre dos
variables estadísticas.
2. Índice:
1. Relación estadística: Correlación
2. Diagramas de dispersión o nube de puntos
3. Tablas de frecuencia: Distribuciones marginales y
distribuciones condicionada
4. Parámetros estadísticos bidimensionales
4.1 Media y desviación marginal
4.2 Covarianza
4.3 Coeficiente de correlación lineal
5. Rectas de regresión
3. 1. Relación Estadística: Correlación
La correlación trata de establecer la relación o
dependencia que existe entre las dos variables que
intervienen en una distribución bidimensional.
Es decir, determinar si los cambios en una de las variables
influyen en los cambios de la otra. En caso de que suceda,
diremos que las variables están correlacionadas o que hay
correlación entre ellas.
4. Tipos de correlación:
1º Correlación directa 2º Correlación inversa 3º Correlación nula
La correlación directa se La correlación inversa se La correlación nula se da
da cuando al aumentar una da cuando al aumentar cuando no hay
de las variables la otra una de las variables la dependencia de ningún
aumenta. otra disminuye. tipo entre las variables.
La recta correspondiente La recta correspondiente En este caso se dice que
a la nube de puntos de la a la nube de puntos de la las variables son
distribución es una recta distribución es una recta incorreladas y la nube de
creciente. decreciente. puntos tiene una forma
redondeada.
6. Grado de correlación:
Correlación fuerte Correlación débil
La correlación será La correlación será débil
fuerte cuanto más cerca cuanto más separados estén
estén los puntos de la los puntos de la recta.
rec1.ta.
7. 2. Diagramas de dispersión o nube
de puntos
En las distribuciones bidimensionales a cada individuo le corresponden los
valores de dos variables, las representamos por el par (xi, yi).
Si representamos cada par de valores como las coordenadas de un punto, el
conjunto de todos ellos se llama nube de puntos o diagrama de dispersión.
Sobre la nube de puntos puede tazarse una recta que se ajuste a ellos lo
mejor posible, llamada recta de regresión.
Ejemplo:
Las notas de 12 alumnos de una clase en Matemáticas y
Física son las siguientes:
Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10
Física 1 3 2 4 4 4 6 4 6 7 9 10
8. 3. Tablas de frecuencia: Distribuciones
marginales y distribuciones condicionada
Distribuciones marginales:
Las distribuciones marginales son las distribuciones unidimensionales que nos informan del
número de observaciones para cada valor de una de las variables,(prescindiendo de la
información sobre los valores de las demás variables).
En el caso bidimensional hay dos (una para la x y otra para la y), en el caso multidimensional
hay tantas como variables.
A partir de la tabla de correlación pueden construirse las distribuciones marginales, asignando
a cada valor de la variable considerada su frecuencia marginal.
Distribuciones condicionadas:
Nos especifican las observaciones que hay de cada valor de una de las variables cuando
imponemos la condición de que la otra toma un valor determinado.
Esto supone considerar únicamente una columna de la tabla de correlación (distribución de x
condicionada a un valor de y) o una fila de la tabla (distribución de y condicionada a un valor
de x).
9. 4.Parámetros estadísticos
bidimensionales
Media y desviación marginal:
La media y la desviación marginal son respectivamente la media
aritmética y la desviación típica calculadas con las distribuciones
marginales
Covarianza
:
La covarianza (Sxy), es una manera de generalizar la varianza y se
define como:
La covarianza busca comparar los
resultados obtenidos en
diferentes variables, con el objeto
de establecer si hay una relación.
10. Coeficiente de correlación lineal
El coeficiente de correlación lineal es el cociente entre la covarianza y el
producto de las desviaciones típicas de ambas variables.
El coeficiente de correlación lineal se expresa mediante la letra r.
Propiedades del coeficiente de correlación:
1. El coeficiente de correlación no varía al hacerlo la escala de medición.
2. El signo del coeficiente de correlación es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlación es directa.
Si la covarianza es negativa, la correlación es inversa.
Si la covarianza es nula, no existe correlación.
3. El coeficiente de correlación lineal es un número real comprendido entre −1 y 1.
−1 ≤ r ≤ 1
11. 5. Rectas de regresión
La recta de regresión es la que mejor se ajusta a la nube de puntos y pasa
por el punto centro de gravedad llamado centro de gravedad.
Recta de regresión de Y sobre X Recta de regresión de X sobre Y
La recta de regresión de Y sobre La recta de regresión de X sobre Y
X se utiliza para estimar los se utiliza para estimar los valores
valores de la Y a partir de los de de la X a partir de los de la Y.
la X. La pendiente de la recta es el
La pendiente de la recta es el cociente entre la covarianza y la
cociente entre la covarianza y la varianza de la variable Y.
varianza de la variable X.