SlideShare uma empresa Scribd logo
1 de 121
UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI




ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL




 ESTADISTICA DESCRIPTIVA

                  MCS : JORGE POZO



                PORTAFOLIO DEL DOCENTE
                     MARICELA AYALA




             MARZO 2012 – AGOSTO 2012


                     Tulcán – Ecuador

                           2012
´

                                CORRELACIÓN

TÉCNICAS DE CORRELACIÓN

En los capítulos anteriores, ustedes estudiaron las distribuciones de una sola
variable. A continuación abordaremos el estudio de dos variables y no
solamente de una. Particularmente estudiaremos qué sentido tiene afirmar que
dos variables están relacionadas linealmente entre sí y cómo podemos medir
esta relación lineal.




RELACIONES LINEALES ENTRE VARIABLES

Supongamos que disponemos de dos pruebas una de ellas una prueba de
habilidad mental y la otra una prueba de ingreso a la Universidad.
Seleccionemos cinco estudiantes y presentamos en la tabla Nº4.1.1, los
puntajes obtenidos en estas dos pruebas.

                                 TABLA Nº4.1.1

                                   X
                                PRUEBA
                                                       Y
                 ESTUDIANTES      DE
                                               EXAMEN DE ADMISIÓN
                               HABILIDAD
                                MENTAL
                 María            18                  82
                 Olga             15                  68
                 Susana           12                  60
                 Aldo             9                   32
                 Juan             3                   18


Observamos las cinco parejas de puntajes de la tabla Nº4.1.1 ¿podemos
afirmar que la prueba de habilidad mental se puede usar para pronosticar el
puntaje de examen de admisión?. La tabla nos dice que si podemos hacer tal
suposición ya que los estudiantes con puntajes altos en la prueba de habilidad
mental tienen también un puntaje alto en el examen de admisión y los
estudiantes con puntajes bajos en la prueba de habilidad mental, tienen
puntajes bajos en el examen de admisión. En circunstancias como la presente
(cuando los puntajes altos de una variable están relacionados con los puntajes
altos de la otra variable y los puntajes bajos de una variable están relacionados
con los puntajes bajos de la otra variable), afirmamos que hay una relación
lineal positiva entre las dos variables, entonces podemos definir una relación
lineal positiva entre ese conjunto de pares de valores X y Y, tal como se
muestra en la tabla Nº4.1.1.




Supongamos que en lugar de los resultados de la tabla Nº 4.1.1, hubiéramos
obtenido los puntajes que se muestran en la tabla Nº 4.1.2 ¿Podríamos afirmar
que en esta situación los puntajes de la prueba de habilidad mental pueden
usarse para pronosticar los puntajes altos en el test de habilidad mental
aparecen con puntajes bajos en el examen de admisión y los sujetos con
puntajes altos en el examen de admisión, entonces podemos definir una
relación lineal negativa entre un conjunto de pares de valores X y Y (tal como
en la tabla Nº4.1.2), es decir, los puntajes altos de X están apareados con los
puntajes bajos de Y y los puntajes bajos de X están apareados con los puntajes
altos de Y.

                                 TABLA Nº4.1.2

                                   X                Y
                                PRUEBA
                                  DE
                ESTUDIANTES                EXAMEN DE ADMISIÓN
                               HABILIDAD
                                MENTAL
                María             18               18
                Olga              15               32
                Susana            12               60
                Aldo              9                68
                Juan              3                82


                                 TABLA Nº4.1.3
X                 Y
                               PRUEBA
                                 DE
                ESTUDIANTES                EXAMEN DE ADMISIÓN
                              HABILIDAD
                               MENTAL
                María             18                18
                Olga              15                82
                Susana            12                68
                Aldo              9                 60
                Juan              3                 32


Examinemos ahora la tabla Nº4.1.3. en este caso ya no podemos afirmar que
los puntajes de la prueba de habilidad mental sirvan para pronosticar los
puntajes del examen de admisión, ya que unos puntajes altos del test de
habilidad mental están aparejados con otros puntajes bajos del examen de
admisión y algunos puntajes bajos del test de habilidad mental están apareados
con otros puntajes altos del examen de admisión, entonces, en este caso,
decimos que no existe una relación lineal entre las variables X y Y.




DIAGRAMA DE DISPERSIÓN

En las situaciones que se presentan en la vida real no tenemos solamente cinco
parejas de valores para ambas variables, sino muchísimas parejas. Otra forma
alternativa de ver si existe o no relación lineal entre dos variables sería hacer
una gráfica de los valores X y Y en un sistema de coordenadas rectangulares,
este tipo de gráfica es conocido con el nombre de diagrama de dispersión,
gráfico de dispersión o nube de puntos. Dibujemos el diagrama que
corresponde a la tabla Nº4.1.1. lo haremos haciendo corresponder a cada valor
de la variable independiente X, un valor de la variable dependiente Y, es decir,
para la alumna Susana haremos corresponder su puntaje en la prueba de
habilidad mental (12) con su puntaje de la prueba de admisión (60); al alumno
Juan le hacemos corresponder su puntaje del test de habilidad mental (3) con
su puntaje del examen de admisión (18). Luego ubicaremos los cinco pares de
puntajes en el sistema de ejes rectangulares y obtendremos los gráficos Nº4.1.1
y Nº4.1.2.




Observaremos en el gráfico Nº4.1.1, que tabla Nº4.1.1, es descrita por el
diagrama de dispersión. Vemos en este gráfico que los cinco puntos dan la
sensación de ascender en línea recta de izquierda a derecha. Esto es
característico en datos en los que existe una relación lineal positiva. Aunque
estos cinco datos no configuren una línea recta en forma perfecta, se puede
trazar una línea recta que describa en estos puntos en forma bastante
aproximada, conforme se ve en el gráfico Nº4.1.2 y por esto decimos que la
relación es lineal.




Si ocurre que todos los puntos de la gráfica de dispersión están incluidos en
una sola línea en forma exacta afirmamos que la relación lineal es perfecta. El
grado en que se separan los puntos de una sola línea recta nos da el grado en
que la relación lineal no es perfecta. Así cuando menos puntos se encuentran
en una sola línea decimos que la relación lineal entre las dos variables es
menos fuerte y cuando más puntos queden incluidos en una línea recta
afirmaremos que la relación lineal es más fuerte.




                              GRÁFICO Nº4.1.1.
GRÁFICO Nº4.1.2




Usando los datos de la tabla Nº4.1.2 y utilizando la misma forma de razonar
empleada hasta ahora podemos construir el correspondiente gráfico de
dispersión, tal como se muestra en el gráfico Nº4.1.3.




Podemos observar en el gráfico Nº4.1.4 que la nube de puntos de la gráfica
puede delinearse bien por una línea recta, lo que nos indica que hay una
relación lineal entre las dos variables X y Y. vemos también que la línea
desciende de izquierda a derecha (tienen pendiente negativa) por lo que
decimos que la relación lineal entre las dos variables es negativa.
Si tenemos en cuenta la tabla Nº4.1.3 podemos obtener una figura como se
muestra en la gráfica Nº4.1.5. Notamos, en esta situación, que resultará inútil
cualquier línea recta que trate describir adecuadamente este diagrama de
dispersión.




                              GRÁFICO Nº4.1.3




                              GRÁFICO Nº4.1.4
GRÁFICO Nº4.1.5




COEFICIENTE DE CORRELACIÓN RECTILINEA DE PEARSON

Con ayuda de las gráficas nos podemos formar una idea si la nube de puntos, o
diagrama de dispersión, representa una relación lineal y si esta relación lineal
es positiva o negativa, pero con la sola observación de la gráfica no podemos
cuantificar la fuerza de la relación, lo que si conseguiremos haciendo uso del
coeficiente r de Pearson.




El coeficiente de correlación r de Pearson, forma valores comprendidos entre -1
y +1 pasando por 0. El número -1 corresponde a una correlación negativa
perfecta (los puntos del diagrama de dispersión deben encontrarse formando
perfectamente una línea recta). El coeficiente de correlación r=0 se obtiene
cuando no existe ninguna correlación entre las variables. Los valores negativos
mayores que -1 indican una correlación negativa y los valores positivos
menores que 1 indican una correlación positiva. Referente a la magnitud de r
podemos decir que independientemente del signo, cuando el valor absoluto de r
esté más cerca de uno, mayor es la fuerza de la correlación, as así que -0.20 y
+0.20 son iguales en fuerza (ambos son dos valores fuertes).




CÁLCULO DEL COEFICIENTE r DE PEARSON UTILIZANDO UNA MÁQUINA
    CALCULADORA CUANDO LOS DATOS NO SON MUY NUMEROSOS

Dadas dos variables X y Y con sus respectivos valores. Tabla Nº4.1.4, podemos
calcular el coeficiente r de Pearson con una máquina calculadora mediana la
siguiente fórmula.




                            TABLA AUXILIAR Nº4.1.4.

           (1)       (2)          (3)           (4)            (5)
           x          Y           x2             y²            XY
18         82          324            6724            1476
           15         68          225            4624            1020
           12         60          144            3600            7200
           9          32           81            1024            288
           3          18           9              324             54
        ∑x = 57    ∑y= 260     ∑x² = 783      ∑y² = 16296     ∑xy = 3558



Con los datos de la tabla Nº4.1.1, se ha elaborado la Tabla Auxiliar Nº4.1.4.




En las columnas (1) y (2) se han escrito los valores de X y Y. en la columna (3),
se han elevado al cuadrado los valores de X. en la columna (4) se han elevado
al cuadrado los valores de Y. en la columna (5) se ha efectuado el producto de
cada pareja de valores X y Y. aplicando los datos en la fórmula 4.1.1, se tiene:




INTERPRETACIONES DE UN COEFICIENTE DE CORRELACIÓN
¿Qué tan elevado es un coeficiente de correlación dado?. Todo coeficiente de
correlación que no sea cero indica cierto grado de relación entre dos variables.
Pero es necesario examinar más esta materia, porque el grado de intensidad de
relación se puede considerar desde varios puntos de vista. No se puede decir
que un r de 0.50 indique una relación dos veces más fuerte que la indicada por r
de 0.25. ni se puede decir tampoco que un aumento en la correlación de r=0.40
a r=0.60 equivalga a un aumento de r=0.70 a r=0.90. es de observar que una
correlación de -0.60 indica una relación tan estrecha como una correlación de
+0.60, la relación difiere en la dirección.




Siempre que esté establecida fuera de toda duda razonable una relación entre
dos variables, el que el coeficiente de correlación sea pequeño puede significar
únicamente que la situación medida está contaminada por algún factor o
factores no controlados. Es fácil concebir una situación experimental en la cual,
si se han mantenido constantes todos los factores que no sean pertinentes, el r
podría haber sido 1 en lugar de 0.20. por ejemplo: generalmente la correlación
entre la puntuación de aptitud y el aprovechamiento académico es 0.50 puesto
que ambos se miden en una población cuyo aprovechamiento académico
también es influenciable por el esfuerzo, las actitudes, las peculiaridades de
calificación de los profesores, etc. Si se mantuvieran constantes todos los
demás factores determinantes del aprovechamiento y se midieran exactamente
la aptitud y las notas, el r sería 1 en vez de 0.50.




Una conclusión práctica a la correlación es que ésta es siempre relativa a la
situación dentro de la cual se obtiene y su magnitud no representa ningún
hecho natural absoluto. El coeficiente de correlación es siempre algo puramente
relativo a las circunstancias en que se ha obtenido y se ha de interpretar a la luz
de esas circunstancias y sólo muy rara vez en algún sentido absoluto.
Además podemos agregar que la interpretación de un coeficiente de correlación
como medida del grado de relación lineal entre dos variables, es una
interpretación como medida del grado de relación lineal entre dos variables, es
una interpretación matemática pura y está completamente desprovista de
implicaciones de causa y efecto. El hecho de que dos variables tiendan a
aumentar o disminuir al mismo tiempo no implica que obligadamente una tenga
algún efecto directo o indirecto sobre la otra.




A continuación calcularemos con la fórmula Nº4.1.1, antes indicada coeficiente
de Pearson de la relación presentada en la tabla Nº4.1.2




                            CUADRO AUXILIAR 4.1.5

                (1)         (2)         (3)       (4)        (5)
                 x           Y          x2        y²         XY
                18          18         324         324       324
                15          32         225        1024       480
                12          60         144        3600       720
                9           68          81        4624       612
                3           82          9         6724       246
                                                            ∑xy =
             ∑x = 57     ∑y= 260    ∑x² = 783 ∑y² = 16296
                                                            2382
Vemos que la correlación es fuerte y negativa.




Ahora calculemos con la misma fórmula de Pearson Nº4.1.1, el Coeficiente de
Correlación lineal con los datos de la tabla Nº4.1.3.




                           CUADRO AUXILIAR 4.1.6

               (1)        (2)         (3)          (4)      (5)
                x          Y          x2           y²       XY
               18          18         324          324       324
               15          32         225         6724      1230
               12          60         144         4624       816
               9           68          81         3600       542
               3           82          9          1024       96
            ∑x = 57     ∑y= 260    ∑x² = 783 ∑y² = 16296 ∑xy = 3006
La correlación es muy débil y positiva.




CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN
CLASES

El presente tema nos conduce a calcular el coeficiente de correlación r, que nos
proporciona información de la fuerza de la relación que existe entre dos
conjuntos de datos que se encuentran agrupados, cada uno de ellos formando
por separados una distribución de frecuencias, mejor dicho teniendo por
separado sus intervalos de clase con sus respectivas frecuencias.

Para realizar una exposición del tema en forma más entendible, presentamos el
ejemplo del Cuadro Nº 4.1.7.

Ejemplo:

Calcular el grado de correlación entre las puntaciones obtenidas en inventario
de hábitos de estudio y los puntajes obtenidos en un examen de Matemática,
aplicados a un total de 134 alumnos de un colegio de la localidad.




                               CUADRO Nº 4.1.7

 X Hábitos de estudio
20 30      30 40    40 50   50 60     Total
Y Matemática
        70 80                            3      2        2         7
        60 70                   1        0      4        5        10
        50 60                   2        6      16       3        27
        40 50                   4        14     19      10        47
        30 40                   7        15     6        0        28
        20 30                   8        2      0        1        11
        10 20                   1               1        2         4
        Total                   23       40     48      23       134



Podemos notar que el problema no es tan simple, como el caso anterior, dado
que ahora los datos se han clasificado en una tabla de doble entrada Nº 4.1.7.
Este cuadro muestra, en la primera columna del lado izquierdo los intervalos de
clase de la variable Y, los que cubren todos los posibles datos acerca de las
puntuaciones alcanzadas por los estudiantes en la prueba de Matemática.
Nótese que los intervalos crecen de abajo hacia arriba. En la fila superior se
presentan los intervalos de clase todos los 134 posibles datos acerca de los
puntajes obtenidos por los estudiantes en la variable hábitos de estudios
representados por la letra X.

Dentro del Cuadro Nº 4.1.7 en los casilleros interiores o celdas de la tabla, se
encuentran las frecuencias de celdas          que corresponden a puntajes que
pertenecen tanto a un intervalo de la variable Y como a un intervalo de la
variable X.

En la fila interior del Cuadro se presentan los totales de los puntajes de la
variable X, hábitos de estudio. Esos totales se llaman frecuencias marginales de
la variable X y se representan por   .
En la última columna de la derecha se encuentran los totales de los puntajes de
la variable rendimiento en matemática. Estos totales se denominan frecuencias
marginales de la variable Y.

Cuando los datos se presentan tal como el presente caso, formando tablas de
doble entrada, es conveniente usar el método clave que expondremos a
continuación porque con este procedimiento se evita manejar grandes números,
como sería el caso si se emplearán las fórmulas para trabajar con la
calculadora de bolsillo.

La fórmula que utilizaremos es la siguiente:




Para obtener los datos que deben aplicarse en la fórmula Nº 4.1.2., vamos a
construir el cuadro auxiliar Nº 4.1.8, al mismo tiempo que se explica el
significado de los símbolos de esa fórmula.

Lo primero que hacemos es reemplazar los intervalos horizontales y verticales
por sus respectivas marcas de clase; a continuación adicionaremos al Cuadro
Nº 4.1.7, cinco columnas por el lado derecho; cuyos encabezamientos son:
    para la primera    para la segunda,        para la tercera,        para la cuarta
y          para la quinta columna.

Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran:
para la primera       para la segunda fila que está debajo de la anterior,      para
la tercera fila y por último,       para la cuarta fila que está debajo de todas; de
esta manera se va elaborando el Cuadro Auxiliar Nº 4.1.8.

1) Para determinar las frecuencias marginales que se deben colocar en la
     columna      para la primera       para la segunda,          para la tercera,
sumamos las frecuencias de las celdas que están en la misma fila de la
   marca de clase 75, obtenemos: 3+2+2=7, número que se escribe en el
   primer casillero o celda de la columna    para la primera     para la segunda,
         para la tercera,     En la fila de la marca de clase 65, sumamos
   1+4+5=10, número que se escribe debajo del 7.
   Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27.
   Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47.
   En igual forma: 7+15+6=28.
   Lo mismo: 8+2+1=11
   Y en la última fila: 1+1+2=4
   A continuación sumamos estas frecuencias marginales de la variable Y:
   7+10+27+47+28+11+4=134 es el total general.


2) Ahora a determinar las frecuencias marginales de la variable X: En columna
   encabezada con la marca de clase 25 sumemos verticalmente las
   frecuencias: 1+2+4+7+8+1=23.
   En la columna encabezada con 35, tenemos: 3+6+14+15+2=40
   En la siguiente: 2+4+16+19+6+1=48
   En la última: 2+5+3+10+1+2=23


3) Centremos nuestra atención en la columna encabezada            para la primera
      para la segunda,        para la tercera,    este signo significa desviación
   unitaria, y procedemos en la misma forma que en las Tablas Nº 2.1.2 y Nº
   2.1.3 (b). recuerden que las desviaciones unitarias positivas: +1, +2, y +3
   corresponden a los intervalos mayores y por el contrario las desviaciones
   unitarias negativas: -1, -2 y -3 corresponden a los intervalos menores. Como
   origen de trabajo se tomó la marca de clase 45 y por lo tanto su desviación
   unitaria es cero.


4) Luego vamos a determinar las desviaciones unitarias horizontales de la
   variable X. el origen de trabajo es la marca de clase 45 que se halla en la fila
superior del cuadro, por esa razón, escribimos cero debajo de la frecuencia
    marginal 48. Las desviaciones unitarias negativas: -1 y -2 se escriben a la
    izquierda cero, porque se corresponden con los intervalos de clase que
    tienen menores marcas de clase y que están a la izquierda de 45. La
    desviación unitaria positiva, se corresponde con el intervalo de mayor marca
    de clase, 55 (en parte superior del Cuadro Nº 4.1.8.)



5) A continuación vamos a determinar los valores que deben colocarse en la
    columna encabezada           ; este símbolo indica que se debe multiplicar cada
    valor de      por su correspondiente valor de          , así: 7(+3)=21; 10(+2)=20;
    27(+1)=27;     47(0)=0;    28(-1)=-28;    11(-2)=-22     y   4(-3)=-12.   Sumando
    algebraicamente, tenemos: 21+20+27=68 los positivos: y                (-28)+ (-22)+
    (-12)=-62 los negativos.


    Por último: 68-62=6 total, que se coloca en la parte inferior de la columna




Para obtener los valores de la cuarta columna encabezada                      debemos
tener en cuenta que (                        , por lo tanto basta multiplicar cada valor
de la segunda columna por su correspondiente valor de la tercera columna así
se obtiene el respectivo valor de la cuarta columna. En efecto:

(+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-3)(-
12)=36

La suma: 63+40+27+28+44+36=238

Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que
(        =       por consiguiente basta multiplicar verticalmente un valor de la
primera fila por su correspondiente valor de la segunda dila para obtener el
respectivo valor de la tercera fila.
(23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23




Sumando horizontalmente:

(-46)+ (-40)+ (23)=-86+23=-63




Vamos por la cuarta fila; vemos que                       . Luego basta multiplicar
cada elemento de la segunda fila por su correspondiente elemento de la tercera
fila para obtener el respectivo elemento de la cuarta fila así:

(-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23




Para obtener los valores de la quinta columna                 observamos que hay
tres factores; el 1º es la frecuencia         de la celda o casillero que se está
considerando, el segundo factor es la desviación unitaria         , el tercer factor es
la desviación unitaria    . Por tanto el procedimiento será el siguiente: Tomemos
el número 3 que es la frecuencia de la celda determinada por el cruce de los
intervalos que tienen la marcha de clase 75 horizontalmente y 35 verticalmente.




Bajemos la vista del número 3 hacia donde se halla el respectivo valor (-1) de la
desviación unitaria      (ver la línea punteada).




Para indicar el tercer factor corremos la vista del número 3 hacia su derecha
hasta llegar a la columna de las desviaciones unitarias      y ubicamos el número
+3 (ver la línea punteada) formemos el producto de estos tres números: (3) (-1)
(+3)=-9. Este número -9 encerrado en un semicírculo lo escribimos en la celda
elegida.
En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0

Continuando hacia la derecha: (2) (+1) (+3)=6




                         CUADRO AUXILIAR Nº 4.1.8
CUADRO CORREGIDO DEL CUADRO AUXILIAR Nº 4.1.8




La fórmula del paso (9) lleva el signo para indicar que se deben sumar
horizontalmente los números que están encerrados en los semicírculos de esa
primera fila elegida, así: -9+0+6=-3. Este número se escribe en la quinta
columna.

Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un semicírculo.

(0)(-1)(+2)=0

(4)(0)8+2)=0

(5)(+1)(+2)=10
Sumando 0+0+10=10

Ahora con la tercera fila:

(2)(-2)(+1)=-4

(6)(-1)(+1)=-6

(16)(0)(+1)=0

(3)(+1)(+1)=3

Sumando: (-4)+(-6)+0+3=-7

Cuarta fila:

(7)(-2)(-1)=14

(15)(-1)(-1)=15

(6)(0)(-1)=0

(0)(+1)(-1)=0

La suma es: 14+15=29

(8)(-2)(-2)=32

(2)(-1)(-2)=4

(0)(0)(-2)=0

(1)(+1)(-2)=-2

La suma es: 32+4-2=34

Séptima fila:

(1)(-2)(-3)=6

(1)(0)(-3)=-6
(2)(1)(-3)=-6

Sumando: 6+0-6=0

Sumando los valores de la columna quinta.

        -3+6-7+0+29+34+0=69-10=59

Reuniendo los resultados anteriores, se tienen los datos para aplicar en fórmula
Nº 4.1.2.

n=134
EJERCICIO RESUELTO Nº2 DE CÁLCULO DEL COEFICIENTE DE
CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS

Calcular el coeficiente de correlación lineal de las puntuaciones en matemáticas
de 100 estudiantes de la Facultad de Ciencias de la Universidad MN.

                               CUADRO Nº4.1.9
CUADRO Nº4.1.10




En este problema tenemos que calcular el coeficiente de correlación lineal r
para dos conjuntos de datos, constituidos por los calificativos en una escala de
0 a 100, en matemáticas y en física para 100 estudiantes de la Facultad de
Ciencias de cierta Universidad.




Los datos se muestran en el cuadro Nº4.1.9. Notemos que a lo largo de la línea
horizontal superior se encuentran los intervalos que contienen los calificativos
de matemáticas desde 40 hasta 100.




Igualmente en la primera columna vertical izquierda, se encuentran los
calificativos para física de los mismos estudiantes, desde el calificativo 40 hasta
100. Nótese que en la columna de los calificativos de física los datos crecen de
abajo hacia arriba y para la fila horizontal superior vemos que los calificativos en
matemáticas crecen de izquierda a derecha.

A continuación procedemos a calcular el coeficiente de correlación r para estos
datos aplicando el mismo método que utilizamos en el problema anterior.




1) Traslademos los datos del cuadro Nº4.1.9 al cuadro Nº4.1.10. llamaremos
   fxy a cualquiera de las frecuencias de los casilleros interiores del cuadro
   Nº4.1.9. en el cuadro Nº4.1.10 podemos observar que se han agregado
   cinco columnas por el lado derecho y cuatro filas por la parte inferior.




Observaremos en el cuadro Nº4.1.10 que los intervalos para la puntuación en
matemáticas y para la puntuación en física se han reemplazado por las marcas
de clase correspondientes. Así en la fila horizontal superior se ha reemplazado
el primer intervalo 4050 por su marca de clase 45, el segundo intervalo
5060 por su marca de clase 55 y de esta manera se han reemplazado los
demás intervalos por sus marcas de clases en el cuadro Nº4.1.10.




De igual forma para la columna primera de la izquierda vemos que los intervalos
se han reemplazado por sus respectivas marcas de clase así, para la
puntuación en física el primer intervalo superior 90 100 se han reemplazado
por su marca de clase 95, el segundo intervalo superior 8090 se ha
reemplazado por su marca de clase 85 y así sucesivamente hasta llegar el
intervalo inferior 4050 que se ha reemplazado por su marca de clase 45.




Ahora vamos a realizar los pasos siguientes:
1) Para determinar las frecuencias marginales         sumemos todos los valores
      de la primera fila que tiene la marca de clase 95. De esta forma tenemos:
   2+5+5=12. Para la segunda fila que corresponde a la marca de clase 85,
   obtenemos: 1+3+6+5=15 que escribimos en el segundo casillero de                .
   Continuando con la suma de los números,               de las filas llenamos la
   columna       ..
2) Dediquemos nuestra atención a las frecuencias marginales           . El primer
   resultado de       lo obtenemos sumando las frecuencias        para la columna
   que tiene la marca de clase 45, de esta forma tenemos: 2+4+4=10 que se
   escribe en el primer casillero de la fila   . Para el segundo casillero tenemos
   el número 15 que se obtiene sumando verticalmente las frecuencias            de
   la columna que tiene la marca de clase 55. Continuando con la suma de las
      de las demás columnas, llenamos las frecuencias marginales        .
3) Atendamos ahora la columna          . La columna     tiene en total 6 casilleros
   arbitrariamente escogemos uno de estos casilleros como origen de trabajo le
   asignamos el número. Observemos ahora la primera columna de la
   izquierda en donde están las marcas de clase de los puntajes de física. Aquí
   observamos que las marcas de clase crecen de abajo hacia arriba, entonces
   las desviaciones unitarias en la columna        crecerán de abajo hacia arriba.
   Entonces del 0 hacia abajo, las desviaciones unitarias son números
   negativos que van decreciendo hacia abajo.
   Desde el 0 hacia arriba las desviaciones unitarias serán positivas y
   crecientes.


   De manera que podemos observar que la columna             está conformada por
   los siguientes números que crecen del cero hacia arriba: 1,2 y desde el cero
   hacia abajo decrecen: -1, -2, -3.


4) Veamos la fila
Notamos que en la fila horizontal superior las marcas de clase crecen de
   izquierda a derecha, de igual forma las desviaciones unitarias crecerán de
   izquierda a derecha. Elegimos como origen de trabajo arbitrariamente uno
   de los casilleros de    , el tercero contando de izquierda a derecha, y vamos
   asignando números positivos crecientes hacia la derecha del 0, así tenemos
   1, 2 y 3 y hacia la izquierda, a partir del cero, tendremos: -1 y -2.
5) Expliquemos la columna               multipliquemos cada valor de          por su
   correspondiente valor de          y se obtiene un valor        . Por ejemplo el
   número 24 se obtiene multiplicando la frecuencia marginal                  por su
   correspondiente desviación unitaria                esto es, 12x2=24. Para el
   segundo casillero multiplicamos 15x1=15; para el tercero 25x0=0, así hasta
   terminar con 11 x (-3)=-33.
6) Observamos la columna              . La primera celda de esta columna tiene el
   número 48 que se obtiene multiplicando el valor                  de la segunda
   columna por su correspondiente valor            =24, de la tercera columna, es
   decir, 2 x 24 = 48. Para el segundo casillero de la columna             , tenemos
   15 que es igual a 1 x 15. De esta forma continuamos llenando los demás
   valores de la columna         .


7) Veamos ahora la fila        . El número -20 del primer casillero de esta fila se
   obtiene multiplicando la frecuencia marginal             por su correspondiente
   desviación unitaria           , es decir: 10(-2)=-20.


   Para el segundo casillero de           , multiplicamos (-1) x (-15) = 15 y así
   sucesivamente hasta 12 x 3 = 36.



8) Veamos la fila         . El primer casillero de esta fila es 40 y es el resultado
   de multiplicar -2 del primer casillero de la fila                por -20 de su
   correspondiente primer casillero de la fila      esto es. (-2) x (-20) = 40. Para
   el segundo casillero de           multiplicamos -1 del segundo casillero     por -
15 de su correspondiente segundo casillero de          , luego obtenemos (-1) x
   (-15) = 15. Así continuamos multiplicando los valores de los valores de los
   casilleros de la fila       por sus correspondientes valores de la fila
   hasta llegar a (3) (36) =108.


9) Interesa ahora obtener los números encerrados en semicírculos, por
   ejemplo, el número 4, que corresponde a la marca de clase 75 para la
   puntuación en matemáticas y a la marca de clase 95 de la puntuación en
   física.


Para saber cómo se obtiene este número 4, corramos nuestra vista hacia la
derecha dirigiéndose hacia la columna             y obtenemos el número 2. Del
número 4, encerrado en semicírculo, bajemos la vista con dirección a la fila       y
obtenemos 1. La frecuencia del casillero donde está el 4, encerrado en
semicírculo,       es            .    Multiplicando     estos    tres        factores
tendremos:                              .

Podemos enunciar la siguiente regla:




Para obtener los valores encerrados en semicírculos en los casilleros interiores
del cuadro Nº4.1.10, multiplicamos el valor de la frecuencia            del casillero
para la cual estamos haciendo el cálculo, por los valores de las desviaciones
unitarias      y   , obtenidas corriendo la vista hacia la derecha hasta columna
   y también hacia abajo hasta llegar a la fila    .

Así por ejemplo, para el casillero que corresponde a las marcas de clase 75 en
matemática y 85 en física, tenemos la frecuencia de la celda              , los otros
dos factores son:          y    =1.

Luego (3) x (1) x (1) = 3 que es el valor encerrado en semicírculo.
Para el casillero correspondiente a la marca de clase 55 en matemáticas marca
de clase 45 en física, tenemos:

       ,          ,

                                que es el valor encerrado en semicírculo. Así
podemos proceder para obtener todos los demás valores encerrados en
semicírculos.




Sumando las frecuencias marginales de la columna           , se tiene            .
Sumando los valores de la tercera columna se obtiene                    . La suma
de los valores de la quinta columna:

                                           =150




Para todas las filas, en el último casillero de la derecha se tiene la suma de los
valores de la fila. Así por ejemplo.         ;            .

Para la tercera fila:             .

Para la cuarta fila:

Estos totales de filas y columnas reemplazamos en la fórmula Nº4.1.2.
Vemos que el coeficiente de correlación en este caso es 0,79




EJERCICIO PROPUESTO Nº1 DEL CÁLCULO DEL COEFICIENTE DE
CORRELACIÓN ENTRE DOS CONJUNTOS AGRUPADOS DE DATOS.




Supongamos que tenemos 30 sujetos a los que hemos aplicado una prueba de
conocimientos de Psicología General (variable x) y un test de inteligencia
(variable y). los datos se muestran en el Cuadro Nº4.1.11.




Aplicando los datos tomados del Cuadro Auxiliar Nº4.1.12 en la fórmula Nº4.1.2,
tenemos:

Resultado:
REGRESIÓN LINEAL SIMPLE




REGRESIÓN LINEAL SIMPLE

Al comenzar a estudiar las técnicas de              correlación afirmamos que
estudiaríamos dos variables y no solamente una. Llamamos en esa ocasión x a
una de las variables y a la otra. En el tema que nos ocuparemos ahora,
estudiaremos la forma tabla Nº4.2.1, similar a lo que utilizamos correlación,
conocimiento el puntaje en la prueba de habilidad mental (variable x) para un
alumno determinado, podemos anticipar el puntaje del examen de admisión
(variable y) del mismo alumno.

Consideramos la relación lineal expresada por el cuadro Nº4.2.1. si dibujamos
esa relación, obtenemos el gráfico Nº4.2.1. como podemos observar todos los
puntos se alinean “exactamente” en una sola línea recta lo que recibe el nombre
de línea de regresión. Teniendo en cuenta esta línea, podemos predecir
cualquiera de los valores de y conociendo el valor de x: Para x = 25, según la
recta, corresponde y = 35, para x =20, corresponde y=30, etc. En este caso se
trata de una correlación positiva perfecta cuyo coeficiente de correlación es +1.

                                 CUADRO Nº4.2.1


                                    PRUEBA DE       EXAMEN DE
                                 HABILIDAD MENTAL    ADMISIÓN
                                         X              Y
                    Susana               5             15
                    Iván                10             20
                    Lourdes             15             25
                    Aldo                20             30
                    Juan                25             35
                    María               30             40
                    César               35             45
                    Olga                40             50
Recordemos el gráfico Nº4.2.1 que dibujamos cuando estudiamos correlación,
en este gráfico observamos el diagrama de dispersión “aproximado” por una
línea recta, la recta es mejor “ajuste”, a los puntos del diagrama de dispersión,
es decir, en la mejor medida procure dejar igual números de puntos del
diagrama de dispersión por encima de ella que igual número de puntos de
abajo, se llama línea de regresión.




ECUACIÓN DE LA REGRESIÓN RECTILÍNEA

La ecuación que describe la línea de regresión es.


                    X-r



En donde:

   Media de variable y en la muestra




EJEMPLO PROPUESTO Nº2 DEL CÁLCULO DEL COEFICIENTE DE
CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS




Supongamos que se tienen 50 vendedores de cierta compañía. Estos
vendedores durante un año 1985 han realizado ventas tal como lo muestra el
cuadro Nº4.1.13, el que también muestra el número de años de experiencia que
tienen como vendedores.




Para dicho cuadro, se pide calcular el coeficiente de correlación lineal r.
CUADRO Nº4.1.13




Tomando los datos obtenidos en el Cuadro Auxiliar Nº4,1,14 apliquemos en la
fórmula Nº4.1.12, se tiene:




Resultado:
CUADRO AUXILIAR Nº4.1.14
GRÁFICO Nº 4.2.1




 = media de la variable X en la muestra.

X = un valor de la variable X

r = coeficiente de Pearson, de la correlación lineal entre las variables X y Y

     desviación estándar de Y en la muestra

     desviación estándar de X en la muestra

     valor Y resultante del cálculo de la fórmula.




Veamos cómo podemos predecir los valores de Y a partir de los valores de X.
Estudiemos el Cuadro Nº 4.2.1. Cómo el gráfico de este cuadro es una línea
recta ascendente sabemos que su coeficiente de correlación de Pearson r=+1.
Además tenemos los siguientes resultados:
=22.5        11.46       11.46        =32.5

Estos resultados se pueden calcular a partir de los datos del cuadro Nº4.2.1.
Apliquemos estos datos a la fórmula Nº4.2.1, obtenemos la siguiente expresión:


                               X-(1)



Simplificando términos obtenemos:




Escojamos cualquier valor de X del Cuadro Nº4.2.1 por ejemplo para María
X=30, reemplazando este valor en (b).




Vemos en el Cuadro Nº4.2.1 el valor que corresponde a María efectivamente es
40. Es decir, podemos usar la ecuación Nº4.2.1 para predecir los valores de Y
conociendo los valores de X.




Esta fórmula de regresión se puede para dos variables X y Y, entre las cuales
no es obligatorio que exista una correlación lineal perfecta, es decir, no es
obligatorio que r para la correlación entre X y Y sea siempre igual a 1. Este
valor de r para otras aplicaciones de la regresión, puede tomar cualquier valor
distinto.
EJERCICIO RESUELTOS DE REGRESIÓN LÑINEAL SIMPLE

Al aplicar un test de inteligencia a una muestra representativa constituida por
800 alumnos, se obtuvo la puntuación media de 30,4 puntos, con la desviación
estándar de 12.6 puntos.

La edad media de la muestra fue de 14.5 años, con la desviación estándar de
3.2 años.




El coeficiente de correlación lineal de Pearson entre la variable Y, edad de
sujetos estudiados y la variables X, rendimiento mental de los mismos sujetos,
fue r=0,89




Con estos datos se pide determinar la ecuación de regresión rectilínea de edad
en base del puntaje del rendimiento mental.




¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de:

                              25 puntos

                                                            ?

Datos:

 = 14.5




     3.2

     12.6
Aplicando estos datos en la fórmula Nº 4.2.1 se tiene:


                             X-0.89




                   . Es la ecuación de regresión buscada

Respuesta de la primera pregunta




Segunda pregunta




Tercera pregunta




Cuarta pregunta
Quinta pregunta




Sexta pregunta




                               RELACIONES




La correlación se ocupa de establecer la magnitud y la dirección de las
relaciones. Antes de profundizar en estos aspectos particulares de las
relaciones, analizaremos algunas características generales de éstas, con las
cuales podemos comprender mejor el material específico acerca de la
correlación.

                          RELACIONES LINEALES




Para iniciar nuestro análisis de las relaciones, veamos una relación entre dos
variables. La siguiente tabla muestra el salario mensual que percibieron cinco
agentes ventas y el valor en dólares de la mercancía vendida por cada uno de
ellos en ese mes.
AGENTE VARIABLE           X MERCANCÍA             Y VARIABLE
                           VENDIDA ($)            SALARIO ($)
          1                       0                  500
          2                     1000                 900
          3                     2000                 1300
          4                     3000                 1700
          5                     4000                 2100



Podemos analizar mejor la relación entre estas variables si trazamos una
gráfica utilizando los valores X y Y, para cada agente de ventas, como los
puntos de dicha gráfica. Él es una gráfica de dispersión o dispersigrama.




   Una gráfica de dispersión o dispersigrama es una gráfica de parejas de
   valores X y Y.


   La gráfica de dispersión para los datos de los agentes de ventas aparece en
   la figura 6.1. En relación con esta figura, vemos que todos los puntos caen
   sobre una línea recta. Cuando una línea recta describe la relación entre dos
   variables, se dice que esta relación lineal.




   Una relación lineal entre dos variables es aquella que puede representarse
   con la mejor exactitud mediante una línea recta.


   Observe que no todas las relaciones son lineales; algunas son curvilíneas.
   En este caso, al trazar una gráfica de dispersión para las variables X y Y,
   una línea curva ajusta mejor a los datos que una línea recta.
CÁLCULO DE LA (r) DE
     PEARSON
La ecuación para calcular la r de Pearson mediante datos:




Donde          es la suma de los productos de cada pareja de puntajes z.


Para utilizar esta ecuación, primero hay que convertir cada dato en bruto en su
valor transformado. Esto puede tardar mucho tiempo y crear errores de
redondeo. Con algún álgebra, esta ecuación se puede transformar en una
ecuación de cálculo que utilice datos en bruto:




ECUACIÓN PARA EL CÁLCULO DE LA (r) DE PEARSON




Dónde:        es la suma de los productos de cada pareja X y Y,          también
se llama la suma de productos cruzados.




La tabla 6.4 contiene algunos de los datos hipotéticos reunidos a partir de cinco
sujetos.




Datos hipotéticos para el cálculo de la r de Pearson
TABLA 6.4

                 SUBJETIVO       X     Y                 XY
                       A        1     2     1      4     2
                       B        3     5     9      25    15
                       C        4     3     16     9     12
                       D        6     7     36     49    42
                       E        7     5     49     25    35
                    TOTAL       21    22    111    112   106




Utilicemos estos datos para calcular la r de Pearson:
es la suma de los productos cruzados; se determina multiplicando los
datos X y Y para cada sujeto y luego sumando los productos resultantes. El
cálculo de      y de los otros términos aparece en la tabla 6.4. Al sustituir estos
valores en la ecuación anterior, obtenemos.




                       PROBLEMA DE PRÁCTICA 6.1




Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para su
conveniencia, hemos reproducido estos datos en las primeras tres columnas de
la tabla 6.5. En este ejemplo tenemos una relación lineal imperfecta y estemos
interesados en calcular la magnitud y dirección de la relación mediante la r de
Pearson. La solución también aparece en la tabla 6.5.




IQ y el promedio de las calificaciones: cálculo de la r de Pearson
TABLA 6.5

ESTUDIANTE   IQX    PROMEDIO
 NÚMERO             DE DATOS Y
    1        110       1.0        12,100   1.00    110.0
    2        112       1.6        12,544   2.56    179.2
    3        118       1.2        13,924   1.44    141.6
    4        119       2.1        14,161   4.41    249.9
    5        122       2.6        14,884   6.76    317.2
    6        125       1.8        15,625   3.24    225.0
    7        127       2.6        16,129   6.76    330.2
    8        130       2.0        16,900   4.00    260.0
    9        132       3.2        17,424   10.24   422.4
    10       134       2.6        17,956   6.76    384.4
    11       136       3.0        18,496   9.00    408.0
    12       138       3.6        19,044   12.96   496.8
  TOTAL      1503      27.3       189,187 69.13 3488.7
PROBLEMA DE PRÁCTICA 6.2




Tratemos de resolver otro problema. ¿Se ha puesto a reflexionar si es verdad
que los opuestos se atraen? Todos hemos estado ante parejas en las que sus
miembros parecen ser muy diferentes entre sí. ¿Pero esto es lo usual? ¿Qué
fomenta la atracción: las diferencias o las similitudes? Un psicólogo social
abordó este problema pidiendo a 15 estudiantes que respondieran un
cuestionario relacionado con un sus actitudes hacia una amplia gama de temas.
Tiempo después les mostró las “actitudes” de un extraño hacia los mismos
temas y les pidió que evaluaran su agrado o inclinación por el extraño y si,
probablemente, disfrutarían el trabajar con él. En realidad, las “actitudes” del
extraño fueron elaboradas por el experimentador y variaron de sujeto a sujeto,
con respecto a la proporción de actitudes similares que hubo entre el extraño y
el individuo que participó en el experimento. De esa manera, se obtuvieron
datos, para cada sujeto a sus actitudes y la atracción que sintió hacia un
extraño, basada en las actitudes de este último hacia los mismos temas. Si los
iguales se atraen, entonces debería existir una relación directa entre la
atracción hacia un extraño y la proporción de actitudes similares. Los datos se
presentan en la tabla 6.6. Entre mayor sea la atracción, más alto será el
puntaje. El puntaje de atracción máximo es de 14. Calcule el coeficiente de
correlación r de Pearson * para determinar si existe una relación directa entre la
similitud de actitudes y el grado de atracción.
Datos y solución del problema de práctica 6.2




                                TABLA 6.6

ESTUDIANTE      PROPORCIÓN DE      ATRACCIÓN Y
  NÚMERO           ACTITUDES
                  SIMILARES X
     1               0.30              8.9       0.090    79.21   2.670
     2               0.44              9.3       0.194    86.49   4.092
     3               0.67              9.6       0.449    92.16   6.432
     4               0.00              6.2       0.000    38.44   0.000
     5               0.50              8.8       0.250    77.44   4.400
     6               0.15              8.1       0.022    65.61   1.215
     7               0.58              9.5       0.336    90.25   5.510
     8               0.32              7.1       0.102    50.41   2.272
     9               0.72              11.0      0.518   121.00   7.920
     10              1.00              11.7      1.000   136.89   11.700
     11              0.87              11.5      0.757   132.25   10.005
     12              0.09              7.3       0.008    53.29   0.657
     13              0.82              10.0      0.672   100.00   8.200
     14              0.64              10.0      0.410   100.00   6.400
     15              0.24              7.5       0.058    56.25   1.800
  TOTAL              7.34             136.5      4.866   1279.69 73.273
Por lo tanto, con base en estos estudiantes, existe una relación muy fuerte entre
las similitudes y las atracciones.




Una segunda interpretación de la r de Pearson. La r de Pearson también se
puede interpretar en términos de la variabilidad de Y explicada por medio de X.
este punto de vista produce más información importante acerca de r           y la
relación entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se muestra
una relación imperfecta entre X y Y. En este ejemplo, la variable X representa
una competencia de ortografía y la variable Y la habilidad en la escritura de seis
estudiantes de tercer grado. Suponga que queremos predecir la calificación en
la escritura de María, la estudiante cuya calificación en ortografía es de 88. Si
no hubiese una relación entre la escritura y la ortografía.

                         EJERCICIOS DE APLICACIÓN

   1. En un largo curso de introducción a la sociología, un profesor hace dos
       exámenes. El profesor quiere determinar si las calificaciones de los
       estudiantes en el segundo examen correlacionadas con las calificaciones
       del primero. Para facilitar la los, se elige una muestra de ocho estudiar
       calificaciones aparecen en la siguiente tabla.
a. Construya una gráfica de dispersión para datos, utilizando la
   calificación del primer examen como la variable X. ¿Parece lineal
   la relación?
b. Suponga que existe una relación lineal en calificaciones de los dos
   exámenes, calcule la r de Pearson.
c. ¿Qué tan bien explican la relación, las calificaciones del segundo
   examen?

 120

 100

  80

  60
                                                    Series1
  40

  20

   0
       0     20      40      60      80      100
0,629531757




Se puede decir que es una relación Baja y positiva que los dos exámenes
tienen entre si




   2. Un investigador realiza un estudio de la relación entre el consumo de
       cigarros y las enfermedades determinan la cantidad de cigarros fumados
diariamente y de días de ausencia en el trabajo dura último año debido a
una enfermedad para 13 individuos en la compañía donde trabaja este
investigador. Los datos aparecen en la tabla anexa.


           SUJETO        CIGARROS            DÍAS DE
                         CONSUMIDOS          AUSENCIA
                 1             0                 1
                 2             0                 3
                 3             0                 8
                 4            10                10
                 5            13                 4
                 6            20                14
                 7            27                 5
                 8            35                 6
                 9            35                12
                 10           44                16
                 11           53                10
                 12           60                16


   a. Construya una gráfica de dispersión para estos datos: ¿Se ve una
      relación lineal?
   b. Calcule el valor de la r de Pearson.
   c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto
      disminuye el rango de ambas variables. Vuelva a calcular r para
      los sujetos restantes. ¿Qué afecto tiene la disminución del rango
      sobre r?
   d. A utilizar todo el conjunto de datos, ¿qué porcentaje de la
      variabilidad en el número de días de ausencia es explicado por la
      cantidad de cigarros fumados diariamente? ¿De qué sirve ese
      valor?
18
16
14
12
10
 8                           Series1
 6
 4
 2
 0
     0   20   40   60   80
0,6753



         16
         14
         12
         10
         8
         6                            Series1

         4
         2
         0
              0   10   20   30   40
0,0318



3. Un educador ha construido un examen para las aptitudes mecánicas y
   desea determinar si éste es confiable, mediante dos administraciones
   con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10
   estudiantes reciben dos administraciones del examen, donde la segunda
   administración ocurre un mes después que la primera. Los datos
   aparecen en la tabla.




a. Construya una gráfica de dispersión para las parejas de datos.
b. Determine el valor de r.
c. ¿Sería justo decir que éste es un examen confiable? Explique esto al
   utilizar    .
              SUJETO    ADMINISTRACIÓN 1   ADMINISTRACIÓN 2
                   1           10                  10
                   2           12                  15
                   3           20                  17
                   4           25                  25
                   5           27                  32
                   6           35                  37
                   7           43                  40
                   8           40                  38
                   9           32                  30
                   10          47                  49
60
         50
         40
         30
                                 Series1
         20
         10
          0
              0   20   40   60




0,9881
La investigación no es confiable por que los datos son tomados en dos fecha
totalmente distintas



   4. Un grupo de investigadores ha diseñado un cuestionario sobre la tensión,
      consistente en 15 sucesos. Ellos están interesados en determinar si
      existe una coincidencia entre dos culturas acerca de la cantidad relativa
      de ajustes que acarrea cada suceso. El cuestionario se aplica a 300
      estadounidenses y 300 italianos. Cada individuo debe utilizar el evento
      “matrimonio” como estándar y juzgar los demás eventos en relación con
      el ajuste necesario para el matrimonio. El matrimonio recibe un valor
      arbitrario de 50 puntos. Si se considera que un evento requiere de más
      ajustes que el matrimonio, el evento debe recibir más de 50 puntos. El
      número de puntos excedentes depende de la cantidad de ajustes
      requeridos. Después de que cada sujeto de cada cultura ha asignado
      puntos a todos los eventos, se promedian los puntos de cada evento. Los
      resultados aparecen en la siguiente tabla:
EVENTOS                        ESTADOUNIDENSES              ITALIANOS
Muerte de la esposa                       100                  80
Divorcio                                  73                   95
Separación de la pareja                   65                   85
Temporada en prisión                      63                   52
Lesiones personales                       53                   72
Matrimonio                                50                   50
Despedido del trabajo                     47                   40
Jubilación                                45                   30
Embarazo                                  40                   28
Dificultades sexuales                     39                   42
Reajustes económicos                      39                   36
Problemas con la familia
política                                  29                   41
Problemas con el jefe                     23                   35
Vacaciones                                13                   16
Navidad                                   12                   10



    a. Suponga que los datos tienen al menos una escala de intervalo y
           calcule la correlación entre los datos estadounidenses y la de los
           italianos.
    b. Suponga que los datos sólo tienen una escala ordinal y calcule la
           correlación entre los datos de ambas culturas.
100

 80

 60

 40                        Series1

 20

  0
      0   50   100   150
0,8519



La     r es alta   y positiva es decir que los comportamiento de las dos
nacionalidades son bastante similares




      INDIVIDUO     EXÁMEN CON LÁPIZ        SIQUIATRA      SIQUIATRA
                          Y PAPEL                 A              B
           1                  48                 12              9
           2                  37                 11             12
           3                  30                  4              5
           4                  45                  7              8
           5                  31                 10             11
           6                  24                  8              7
           7                  28                  3              4
           8                  18                  1              1
           9                  35                  9              6
          10                  15                  2              2
          11                  42                  6             10
          12                  22                  5              3




     5. Un psicólogo ha construido un examen lápiz - papel, a fin de medir la
        depresión. Para comparar los datos del examen con los datos de los
        expertos, 12 individuos “con perturbaciones emocionales” realizan el
examen lápiz – papel. Los individuos también son calificados de manera
independiente por dos siquiatras, de acuerdo con el grado de depresión
determinado por cada uno como resultado de entrevistas detalladas. Los
datos aparecen a continuación. Los datos mayores corresponden a una
mayor depresión.




   a. ¿Cuál es la correlación entre los datos de los dos siquiatras?
   b. ¿Cuál es la correlación entre las calificaciones del examen con
      lápiz y papel y los datos de cada siquiatra?




         14
         12
         10
          8
          6                                          Series1
          4
          2
          0
              0        5          10         15
0,8519

La relación se da con un mismo criterio por los psiquiatras

                  14
                  12
                  10
                   8
                   6                                     Series1
                   4
                   2
                   0
                       0       20        40        60
0,6973

La relación entre las dos variables es baja y positiva
14

        12

        10

         8

         6                      Series1

         4

         2

         0
             0   20   40   60




0,697
6. Para este problema, suponga que usted es un psicólogo que labora en el
   departamento de recursos humanos de una gran corporación. El
   presidente de la compañía acaba de hablar con usted acerca de la
   importancia de contratar personal productivo en la sección de
   manufactura de la empresa y le ha pedido que ayude a mejorar la
   capacidad de la institución para hacer esto. Existen 300 empleados en
   esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la
   corporación sólo ha recurrido a entrevistas para elegir a estos
   empleados. Usted busca bibliografía y descubre dos pruebas de
   desempeño, lápiz – papel, bien estandarizadas, y piensa que podrían
   estar relacionados con los requisitos desempeño de esta sección. Para
   determinar si alguna de ellas se puede utilizar como dispositivo de
   selección, elige 10 empleados representativos de la sección de
   manufactura, garantizando que un amplio rango de desempeño quede
   representado en la muestra, y realiza las dos pruebas con cada
   empleado. Los datos aparecen en la siguiente tabla.
   Mientras mayor sea la calificación, mejor será el desempeño. Las
   calificaciones de desempeño en el trabajo. Las calificaciones de
   desempeño fabricados por cada empleado por semana, promediados
   durante los últimos 6 meses.
      a. Construya una gráfica de dispersión del desempeño en el trabajo
         y la primera prueba, utilizando la prueba 1 como la variable X.
         ¿Parece lineal la relación?
      b. Suponga que la relación anterior es lineal y calcule el valor de la r
         de Pearson.
      c. Construya una gráfica de dispersión del desempeño en el trabajo
         y la segunda prueba, utilizando la prueba 2 como la variable X.
         ¿Parece lineal la relación?
      d. Suponga que la relación anterior es lineal, calcule el valor de la r
         de Pearson.
e. Si sólo pudiera utilizar una de las pruebas para la selección de los
   empleados, ¿utilizaría alguna de ellas? En tal caso, ¿cuál de
   ellas? Explique.




                                    EMPLEADO
                       1   2   3   4 5 6 7       8    9 10
   Desempeño en el
   trabajo            50 74 62 90 98 52 68 80 88 76
   Examen 1           10 19 20 20 21 14 10 24 16 14
   Examen 2           25 35 40 49 50 29 32 44 46 35



    120

    100

     80

     60
                                                     Series1
     40

     20

      0
          0           10           20       30
0,5917



         120

         100

          80

          60
                                  Series1
          40

          20

           0
               0   20   40   60
0,9076
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL

                         EVALUACIÓN

                       SEXTO A NOCHE




CÁLCULO DEL COEFICIENTE r DE PEARSON Y REALICE LA GRÁFICA



         ESTUDIANTE      PROPORCIÓN DE        ATRACCIÓN Y
           NÚMERO     ACTITUDES SIMILARES X
             1                0.30                8.9
             2                0.44                9.3
             3                0.67                9.6
             4                0.00                6.2
             5                0.50                8.8
             6                0.15                8.1
             7                0.58                9.5
             8                0.32                7.1
             9                0.72               11.0
             10               1.00               11.7
             11               0.87               11.5
             12               0.09                7.3
             13               0.82               10.0
             14               0.64               10.0
             15               0.24                7.5
EJERCICIO RESUELTO Nº2 DE CÁLCULO DEL COEFICIENTE DE
CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS
DETERMINANCDO EL CUADRO AUXILIAR Y REALICE LA GRÁFICA


                           PRUEBA DE       EXAMEN DE
                        HABILIDAD MENTAL    ADMISIÓN
                                X              Y
              Susana           5              15
              Iván            10              20
              Lourdes         15              25
              Aldo            20              30
              Juan            25              35
              María           30              40
              César           35              45
              Olga            40              50
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL

                          EVALUACIÓN

                      SEXTO A NOCHE




EJERCICIO RESUELTO Nº2 DE CÁLCULO DEL COEFICIENTE DE
CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS
DETERMINANDO EL CUADRO AUXILIAR Y REALICE LA GRÁFICA



                                       ITALIANOS
             ESTADOUNIDENSES
                     100                 80
                     73                  95
                     65                  85
                     63                  52
                     53                  72
                     50                  50
                     47                  40
                     45                  30
                     40                  28
                     39                  42
                     39                  36
                     29                  41
                     23                  35
                     13                  16
                     12                  10
c. Suponga que los datos tienen al menos una escala de intervalo y
                calcule la correlación entre los datos estadounidenses y la de los
                italianos.
            d. Suponga que los datos sólo tienen una escala ordinal y calcule la
                correlación entre los datos de ambas culturas.

BIBLIOGRAFÍA

Legoas, L. A. (2008). Estadística Básica. En L. A. Legoas, Estadística Básica (págs. 177-211). Lima:
        San Marcos.

Mendano, J. (2007). Estadística General. En J. Mendano, Estadística General. México:
      Majangrail.

Zamora, M. C. (2006). Estadística Inferencial. En M. C. Zamora, Estadística Inferencial. Lima:
       Moshera.
Universidad Politécnica Estatal del Carchi

Comercio Internacional, Integración, Administración y
               Economía Empresarial.




Escuela: Comercio Exterior y Negociación Comercial
                     Internacional

               PORTAFOLIO DEL ALUMNO

                     MARICELA AYALA

              ESTADISTICA INFERENCIAL II

                     ING. JORGE POZO

      Nivel: sexto           Paralelo: “a” Noche

                      AÑO-LECTIVO

                         2012
CORRELACIÓN

En capítulos anteriores se estudiaron las distribuciones de una frecuencia,
ordenaremos el estudio de 2 variables y qué sentido tiene afirmar que 2
variables están relacionadas linealmente entre sí.

En la correlación hasta ahora se a abordado en forma general problemas
relacionados únicamente con una solo variable es decir univariados sin
embargo existen muchas situaciones en las cuales se trabaja con pares de
variables, y donde se busca contestar la pregunta de si existe o no una
asociación entre ambas mediciones o variables. (Cortes, 2009)


E l p ro b lem a ce rcan o de la co rre la ció n o gra d o d e in te rco n e xió n
e n t re   va ria b le s   qu e   in t e n ta n   d e te rm in a r     con     qu e     p re cisió n
d e scrib e o e xp lica la re la ció n e n t re va ria b le s, u na e cu ació n lin e a l
o d e cu a lqu ie r o tro t ip o , si t od o s lo s va lo re s d e la s va ria b le s
e st á n   pe rf e ct am en t e   co rre la cio na do s      o       qu e    ha y     co rre la ción
p e rf e cta en t re e llas. (S p ie ge l, 19 9 1 )




COEFICIENTE DE CORRELACIÓN.- Expresa de una manera cuantitativa la
magnitud y dirección de una relación.

Coeficiente de correlación se lo designa en la letra r puede variar entre +1 a -1
el signo nos dice si la relación es positiva o negativa.

    Como +1 es el mayor número posible este representa una relación perfecta
    de una relación positiva.
    Si el coeficiente es -1 que la relación se perfecta que la relación es negativa.
    Cuando la correlación es cero (0) no existe una relación entre x                     y significa
    que x      y no crece ni decrece la recta es horizontal.
COEFICIENTE DE CORRELACIÓN

El coeficiente de correlación de la r de Person toma valores comprendidos entre
-1 y +1 pasando por (o) el numero -1 corresponde a una correlación negativa
perfecta y la +1 a una correlación positiva perfecta el coeficiente de r es igual a
O se obtiene cuando no existe ninguna correlación negativa y os valores
positivos menores que uno indica una correlación positiva.




COEFICIENTE DE CORRELACIÓN

El coeficiente entre la variación explicada y la variación total se llaman
coeficiente de determinación. Si la variación explicada es cero o sea toda la
variación es variación inexplicada, ese coeficiente es cero. Si la variación
inexplicada es cero o sea toda la variación es explicada, el coeficiente es uno.
(Spiegel, 1991)




COEFICIENTE DE CORRELACIÓN

El valor del coeficiente de correlación también llamado de Person ayuda a
contestar la pregunta ¿existe correlación lineal entre las dos variables? El
coeficiente de correlación de r siempre tiene un valor de -1 y +1 indica una
correlación positiva o negativa. (Cortes, 2009)
RELACIÓN PERFECTA.- Es aquella que existe una relación positiva o negativa
para lo cual todos los puntos caen sobre la recta.

RELACIÓN IMPERFECTA.- Es aquella que existe una relación pero no todos
los puntos caen sobre una recta.

Un plano cartesiano con una mejor exactitud mediante una línea recta por la
ecuación.

Y= bx + a

b=pendiente o m=

a= Ordenada




EJEMPLO DE UNA RELACIÓN NEGATIVA

Es una relación negativa perfecta, ya que los valores mayores se asocian con
los otros valores menores de la relación.



                                      Y

                        15                ∆X (8, 13)

                                  ∆Y (20,10)

                                     10



                                      5



                                      X

                    5        10      15        20      25
COEFICIENTE DE CORRELACIÓN DE PEARSON

Todo coeficiente de correlación que no sea cero indica cierto grado de relación
entre 2 variables, lo que el grado de intensidad es fuerte o débil de una
interpretación matemática pura, el hecho de que 2 variables tienden a aumentar
o disminución sobre una de ellas.

La r de Pearson es una medida del grado en el cual las parejas de datos
ocupan posiciones iguales u opuestas dentro sus propias distribuciones.
(PAGANO, Robert. Estadística para las ciencias del comportamiento. En
estadística inferencial. 7a.ed. Mexico. DF: 2006.pp 113 ISBN: 0534617670)



En estadística, el coeficiente de correlación de Pearson es un índice que mide
la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la
covarianza, la correlación de Pearson es independiente de la escala de medida
de las variables. De manera menos formal, podemos definir el coeficiente de
correlación de Pearson como un índice que puede utilizarse para medir el grado
de relación de dos variables siempre y cuando ambas sean cuantitativas.
(Cortes, 2009)




MATEMARICAMENTE Entre 2 variables se lo interpreta como:




INTERPRETACIÓN.- Que tan elevado es el coeficiente de correlación dado
todo r=0 indica cierto grado de relación entre 2 variables, que grado de

Intensidad de relación se puede considerar, si la relación es fuerte o débil.
COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPERMAN

El coeficiente de correlación mide el grado de asociación entre dos cantidades,
pero no mira el nivel de                                 acuerdo              o
concordancia.

Esta prueba estadística                                  permite    medir     la
correlación o asociación de dos variables y es aplicable cuando las mediciones
se realizan en una escala ordinal, aprovechando la clasificación por rangos.
(Spiegel, 1991)



Se utiliza cuando una o ambas variables corresponden solo a una escala
ordinal Sperman es en realidad el coeficiente de correlación lineal r de Pearson
aplicado a los datos que satisfacen los requisitos de una escala ordinal.
(PAGANO, Robert. Estadística para las ciencias del comportamiento. En
estadística inferencial. 7a.ed. Mexico. DF: 2006.pp 121ISBN: 0534617670)

Cuando una o más variables son solo de escala ordinal.




FORMULA MATEMÁTICA:


                              rs = 1-

                              Di= R(xi) – R(yi)




                           EJERCICIO EN CLASE Nº 1

Dados los siguientes conjuntos de parejas de datos muéstrales:
1    1    4    2     1   5
                           4    2    5    4     4   4
                           7    3    8    5     7   3
                           10   4    9    1     10 2
                           13   5    10 4       13 1




a) Utilice la ecuación para el valor de la r de Pearson para cada conjunto.
Observe que en el conjunto B, donde la correlación es menor, algunos de los
valores;




Zx Zy son positivos y otros son negativos. Éstos tienden a cancelarse entre sí,
lo cual hace que r tenga una menor magnitud. Sin embargo, en los conjuntos A
Y C, todos los productos tienen el mismo signo, haciendo que la magnitud de r
aumente. Cuando las parejas de datos ocupan las mismas u opuestas
posiciones dentro de sus propias distribuciones, los productos Zx Zy tienen el
mismo signo, lo cual produce una mayor magnitud de r.




Para A calculamos los valores de         , y las sumatorias respectivas.




b) Calcule r para el conjunto B, utilizando la ecuación para los datos en bruto.
¿Qué prefiere, utilizar la ecuación de los datos en bruto o la de los puntajes z?

C) Sume la constante 5 a los datos X en el conjunto A y calcule r de nuevo,
mediante la ecuación de los datos en bruto. ¿Ha cambiado el valor?
d) Multiplique los datos X del conjunto A por 5 y calcule r de nuevo. ¿ ha
cambiado algún valor?

e) generalice los resultados obtenidos en las partes c y d, restando y dividiendo
los datos entre una constante. ¿Qué le dice esto sobre r ?
2.- En un largo curso de introducción a la sociología, un profesor hace dos
exámenes. El profesor quiere determinar si las calificaciones de los estudiantes
en el segundo examen están correlacionadas con las calificaciones del primero.
Para facilitar, se elige una muestra de ocho estudiantes con las calificaciones
que aparecen en la siguiente tabla.




a) Construya una grafica de dispersión para los datos, utilizando la calificación
del primer examen como la variable X. ¿Parece lineal la ecuación?

b) Suponga que existe una relación lineal en las calificaciones de los dos
exámenes. Calcule el valor de la r de Pearson.

c) ¿Qué tan bien explican, las calificaciones del segundo examen.?
Ejercicio 14:

                                 ejercicio 14
                ESTUDIANTE         EXAMEN1       EXAMEN 2
                    1                   60          60
                    2                   75          100
                    3                   70          80
                    4                   72          68
                    5                   54          73
                    6                   83          97
                    7                   80          85
                    8                   65          90




                ESTUDIANTE         EXAMEN1       EXAMEN 2          X2          Y2
                    1                 60            60               3600        3600
                    2                 75            100              5625       10000
                    3                 70            80               4900        6400
                    4                 72            68               5184        4624
                    5                 54            73               2916        5329
                    6                 83            97               6889        9409
                    7                 80            85               6400        7225
                    8                 65            90               4225        8100
TOTAL                        8           559            653         39739       54687




                  DATOS
                   ∑XY                   46239                               7178,875
                                                                   R=
                   (∑X)                    559                              940835,891
                   (∑Y)                    653
                    n                        8                R=            0,00763032
                   ∑X2                   39739                %             0,76303158
                   ∑Y2                   54687
Se puede analizar que de una perspectiva los estudiante han tenido un
incremento del 73% para la realización del segundo examen es decir las
políticas adoptadas por estudiante docente han funcionado.

La tabla muestra un salario mensual que perciben 5 agentes de ventas el valor
en dólares.

 AGENTE VARIABLE           X MERCANCIA VENDIDA    Y VARIABLE SALARIOS EN
                           EN $                   $

 1                         0                      500
 2                         1000                   900
 3                         2000                   1300
 4                         3000                   1700
 5                         4000                   2100



              2500

              2000

              1500

              1000

              500

                 0
                     0   1000     2000     3000       4000    5000



m =


m=

a= 500

y= ax + b

y=0.40x + 500
La ecuación       y=0.40x + 500   nos indica la relación entre el salario y la
mercadería vendida esto nos indica que y se incrementa 0.4 por cada unitario
de xi, con esta relación podemos producir cualquier valor de y si solo se conoce
el valor de xi.

EJEMPLO

X=1500

Y`= 0,40 x + 500

Y´= 0,40(1500) + 500

Y´= 1100

Así una agente vende $1500 de mercancía y su salario casi igual a $1100
EJERCICIO:

ESTUDIANTE             PRUEBA DE HABILIDAD EXAMEN DE ADMISIÓN
                       MENTAL (X)          (Y)

María                  18                 82
Jessica                15                 68
Carla                  12                 60
Nancy                  9                  32
Juan                   3                  18




GRÁFICA:

          90
          80
          70
          60
          50
          40
          30
          20
          10
           0
               0   5                10    15         20
EJEMPLO DEL COEFICIENTE DE SPERMAN

ESTUDIANTE   COEFICIENTE     X´   PUNTAJE   Y´    Di=x´-y´
             INTELECTUAL X        Y

1            0.30            11   8.9       9     2          4
2            0.44            9    9.3       8     1          1
3            0.67            5    9.6       6     -1         1
4            0               15   6.2       15    0          0
5            0.50            8    8.8       10    -2         4
6            0.15            13   8.1       11    2          4
7            0.58            7    9.5       7     0          0
8            0.32            10   7.1       14    -4         16
9            0.72            4    11        3     1          1
10           1               1    11.7      1     0          0
11           0.87            3    11.5      2     1          1
12           0.09            14   7.3       13    1          1
13           0.89            2    10        4.5   -2.5       6.25
14           0.64            6    10        4.5   1.5        2.25
15           0.24            12   7.5       12    0          0
                                                             41.50




r= 1 -


r= 1 –


r= 1 -

r= 0.93
EJEMPLOS DE EJERCICIOS:

                         X        Y                         x.y
    María         18         82             324   6724    1476
    Olga          15         68             225   4624    1020
    Susana        12         60             144   3600    720
    Aldo          9          32             81    1024    288
    Juan          3          18             9     324     54
                  57         260            783   16296   3558



             r=




               r=




                    r=




                             r=



                                  r= 0.98
EJERCICIO Nº2

GRÁFICA

     12

     10

      8

      6

      4

      2

      0
          0    2   4      6        8   10   12



    ECUACION
RESOLVER EL COEFICIENTE DE PEARSON

                       X   Y                       x.y

         1       6         5    36       25    30

         2       5         3    25       9     15

         3       7         4    49       16    28

         4       10        8    100      64    80

         5       2.5       1    6.25     1     2.5

         6       2.5       6    6.25     36    15

         7       9         10   81       100   90

         8       1         2    1        4     2

         9       11        9    121      81    99

         10      4         7    16       49    28

         11      8         11   64       121   88

         12      12        12   144      144   144

                 78        78   649.50   650   621.50




                  r=




                 r=
r=




                         r=


                              r= 0.80

               COEFICIENTE DE SPERMAN

           X        X´        Y         Y´   Di=x´-y´

1    6          7         5         8        -1         1

2    5          8         3         10       -2         4

3    7          6         4         9        -3         9

4    10         3         8         5        -2         4

5    2.5        10.5      1         12       -1.5       2.25

6    2.5        10.5      6         7        3.5        12.25

7    9          4         10        3        1          1

8    1          12        2         11       1          1

9    11         2         9         4        -2         -4

10   4          9         7         6        3          9

11   8          5         11        2        3          9

12   12         1         12        1        0          0

                                                        48.5
r= 1 -


r= 1 –


r= 1 -

r= 0.83




EJERCICIO Nº3

GRÁFICA

          12

          10

           8

           6

           4

           2

           0
               0    2   4   6   8   10   12




         ECUACION
RESOLVER EL COEFICIENTE DE PEARSON

               X         Y                       x.y

    1      0.30    8.9       0.09    79.21   2.67

    2      0.44    9.3       0.19    86.49   4.09

    3      0.67    9.6       0.45    92.16   6.43

    4      0       6.2       0       38.44   0

    5      0.50    8.8       0.25    77.44   4.4

    6      0.15    8.1       0.02    65.61   1.22

    7      0.58    9.5       0.34    90.25   5.51

    8      0.32    7.1       0.10    50.41   2.27

    9      0.72    11        0.52    121     7.92
10       1                11.7               1          136.89         11.7

     11       0.87             11.5               0.76       132.25         10.01

     12       0.09             7.3                0          53.29          0.66

     13       0.89             10                 0.79       100            8.9

     14       0.64             10                 0.41       100            6.4

     15       0.24             7.5                0.06       56.25          1.8

              7.41             136.50             4.98       1279.69        73.98




                          r=




                     r=


                          r=


                                      r=


                                           r= 0.93

                          COEFICIENTE DE SPERMAN

ESTUDIANTE   COEFICIENTE             X´       PUNTAJE    Y´          Di=x´-y´
             INTELECTUAL X
                                              Y

1            0.30                    11       8.9        9           2            4

2            0.44                    9        9.3        8           1            1

3            0.67                    5        9.6        6           -1           1
4         0      15   6.2    15    0      0

5         0.50   8    8.8    10    -2     4

6         0.15   13   8.1    11    2      4

7         0.58   7    9.5    7     0      0

8         0.32   10   7.1    14    -4     16

9         0.72   4    11     3     1      1

10        1      1    11.7   1     0      0

11        0.87   3    11.5   2     1      1

12        0.09   14   7.3    13    1      1

13        0.89   2    10     4.5   -2.5   6.25

14        0.64   6    10     4.5   1.5    2.25

15        0.24   12   7.5    12    0      0

                                          41.50




r= 1 -


r= 1 –


r= 1 -

r= 0.93
EJERCICIO Nº4

GRÁFICA




     ECUACION
RESOLVER EL COEFICIENTE DE PEARSON

                X         Y                      x.y

    Maria       18        82       324   6724    1476

    Olga        15        68       225   4624    1020

    Susana      12        60       144   3600    720

    Aldo        9         32       81    1024    288

    Juan        3         18       9     324     54

                57        260      783   16296   3558




                    r=




                    r=




                     r=




                              r=
r= 0.98




COEFICIENTE DE SPERMAN

 ESTUDIANTE       COEFICIENTE       X´    PUNTAJE       Y´       Di=x´-y´
              INTELECTUAL X
                                              Y

Maria         18                1        82         1        0              0

Olga          15                2        68         2        0              0

Susana        12                3        60         3        0              0

Aldo          9                 4        32         4        0              0

Juan          3                 5        18         5        0              0

                                                                            0




r= 1 -


r= 1 –


r= 1 -

r= 1
EJERCICIO Nº5

GRÁFICA


                   EJERCICIO N º 5
          90
          80
          70
          60
          50
          40
          30
          20
          10
           0
               0   5      10         15   20



     ECUACION
RESOLVER EL COEFICIENTE DE PEARSON

              X        Y                            x.y

       1     18        18           324     324     324

       2     15        22           225     6724    1230

       3     12        68           144     4624    816

       4     9         60           81      3600    540

       5     3         32           9       1024    96

             57        260          783     16296   3006




                  r=




                  r=




                   r=




                             r=




                                  r= 0.07
COEFICIENTE DE SPERMAN

              X    X´    Y    Y´   Di=x´-y´

         1    18   1     18   5    -4         16

         2    15   2     82   1    1          1

         3    12   3     68   2    1          1

         4    9    4     60   3    1          1

         5    3    5     32   4    1          1

                                              20




r= 1 -


r= 1 –


r= 1 -

r= 0
EJERCICIO Nº6

GRÁFICO


                      EJERCICIO Nº 6
       80

       70

       60

       50

       40

       30

       20

       10

          0
              0   5          10        15   20
RESOLVER EL COEFICIENTE DE PEARSON

               X        Y                             x.y

         1    18        18          324       324     324

         2    15        32          225       1024    480

         3    12        60          144       3600    720

         4    9         68          81        4624    612

         5    3         82          9         6724    246




              57        260         783       16296   2382




                   r=




                   r=




                    r=




                              r=




                                   r= -0.96
EL COEFICIENTE DE PEARSON:

                  X    Y                    x.y

       J       49      48    2401    2304   2352

       K       47      45    2209    2025   2115

       L       42      22    1764    484    924

       P       39      22    1521    484    854

       F       37      40    1369    1600   1480

       Z       32      40    1024    1600   1280

       6       246     217   10288   8497   9009




             r=




              r=




                  r=
r=



                       r= 0.31

         COEFICIENTE DE SPERMAN

    X    X´        Y         Y´    Di=x´-y´

J   49   1         48        1     0          0

K   47   2         45        2     0          0

L   42   3         22        5.5   -2.5       6.25

P   39   4         22        5.5   -1.5       2.25

F   37   5         40        3.5   1.5        2.25

Z   32   6         40        3.5   2.5        6.25

                                              17




               r= 1 -


               r= 1 –

                   r= 1 -

                       r= 0.51
EJERCICIO Nº9

GRÁFICA
EJERCICIOS PROPUESTOS

Resolver los siguientes ejercicios:


   X          Y
       10          7
        8          4
        9          5
       11          4
       11          8
       14          6
       10          9
        9          8
       11          7
       13          5
       15          4
       16          6

   X          Y
       86         15
       74         43
       73         16
       65         11
       82         10
       78         13
       79         14
       70         15
       50         10
       65          9
COEFICIENTE DE CORRELACION




             Expresa de una manera cuantitativa la magnitud y dirección de
             una relación, se lo designa en la letra r puede variar entre +1 a -1
             el signo nos dice si la relación es positiva o negativa.




      Relación perfecta                Relación Imperfecta                  Relación Lineal



Es aquella que existe una            Es aquella que existe una          Existe 2 variables es
relación positiva o negativa         relación positiva o negativa       aquella     que    puede
para lo cual todos los puntos        para   lo   cual   todos   los     representarse en un
                                                                        plano cartesiano con
caen sobre la recta.                 puntos caen sobre la recta.
                                                                        una mejor exactitud
                                                                        mediante una línea
                                                                        recta por la ecuación.




                                                        FORMULAS
                                             PEARSON


                                r=



                                             SPERMAN


                                            rs= 1-
APRENDIZAJE MEDIADO

NIVEL TEÓRICO PRÁCTICO

   Lectura comprensiva de los conceptos básicos de la correlación.
   Analizar los conceptos de la correlación.

NIVEL TEÓRICO AVANZADO

   Elaborar un organizador grafico de la teoría de la correlación.
   Realizar nuestros propios conceptos para mayor entendimiento.

NIVEL TEÓRICO BÁSICO PRÁCTICO

   Resolver    ejercicios   sobre   pruebas    de   psicológicas   realizada   a
     estudiantes aplicando los coeficientes de correlación.
   Establecer problemas y resolverlos aplicando los coeficientes de
     correlación.

NIVEL TEÓRICO BÁSICO PRÁCTICO AVANZADO

   Con datos de importaciones de productos aplicar los coeficientes de
     correlación.
   Resolver ejercicios con datos de exportaciones con la aplicación de los
     coeficientes de correlación.
APRENDIZAJE AUTÓNOMO

NIVEL TEÓRICO PRÁCTICO

   Investigar otros conceptos de la correlación en libros e internet.
   Hacer un resumen de la investigación realizada.

NIVEL TEÓRICO AVANZADO

   Elaboración de un Mentefacto de la correlación.
   Elaboración de ejemplos pequeños para una mayor comprensión de los
     conceptos de la correlación.

NIVEL TEÓRICO BÁSICO PRÁCTICO

   Realizar ejercicios sobre pruebas que se tomaron a estudiantes,
     coeficiente intelectual, psicológicas aplicando los coeficientes de
     correlación.
   Resolver un problema de una investigación realizada sobre el nivel de
     herotina de los monos aplicando los coeficientes de correlación.

NIVEL TEÓRICO BÁSICO PRÁCTICO AVANZADO

   Investigar los datos de importaciones o exportaciones de la página del
     Banco Central del Ecuador en los años 2011- 2012 aplicar los
     coeficientes de correlación.
   Con los datos de las exportaciones o importaciones de datos reales de la
     página del Banco Central recolectando datos del primer trimestre del año
     2011 -2012 aplicar los coeficientes de correlación.
REGRESIÓN LINEAL

La regresión y la correlación están íntimamente ligados, ambos implican la
relación entre 2 variables y utilizan el mismo conjunto de datos básicos.

La regresión se centra en el uso de la relación para determinar una predicción,
cuando la relación es perfecta, esto es cuando todos los puntos están sobre la
recta y se utilizan para señalar la predicción, la situación se hace más compleja
cuando la relación es imperfecta.

Esta recta es la línea de regresión por los mínimos cuadrados. La distancia
vertical en cada punto y la recta representan el error de la predicción, pareciera
que el error total seria la suma algebraica         .

El error total de predicción presentado por                , es menor para la línea
de regresión por mínimos cuadrados.


En estadística la regresión lineal o ajuste lineal es un método matemático que
modeliza la relación entre una variable dependiente Y, las variables
independientes Xi y un término aleatorio (Cortes, 2009).

La palabra regresión se emplea para denotar el proceso de estimar el valor de
una de las variables en función de otra, cuyo valor se considerado. (MARTINEZ, 2001)



La ecuación por los mínimos cuadrados está dado por                      , ecuación
de regresión lineal para predicción y dado por X.

  = Valor predicho

by = Pendiente

ay = Ordenado al origen
FORMULA DE LA REGRESIÓN




ECUACIÓN PARA CALCULAR LA CONSTANTE DE REGRESIÓN




EJERCICIO Nº 1

El aprovechamiento de los estudiantes con relación al promedio de
calificaciones para cada uno.

ESTUDIANTES       APROVECHAMIENTO   PROMEDIO    XY
                  (X)               (Y)
1                 110               1           110       12100
2                 112               1.6         179.20    12544
3                 118               1.2         141.60    13924
4                 119               2.1         249.90    14161
5                 122               2.6         317.20    14884
6                 125               1.8         225       15625
7                 127               2.6         330.20    16129
8                 130               2           260       16900
9                 132               3.2         422.40    17424
10                134               2.6         384.40    17956
11                136               3           408       18496
12                138               3.6         496.80    19044
                  1503              27.30       3488.70   189187
Ejemplo de la grafica de acuerdo con los resultados propuesta de los ejercicios
   donde podemos observar una grafica positiva y unos puntos dispersos.




        Esta es un gráfica con una relación imperfecta positiva (m +).
DETERMINAR EL COEFICIENTE DE PEARSON Y SPERMAN

COEFICIENTE DE PEARSON




COEFICIENTE DE SPERMAN
LA ECUACIÓN LINEAL A TRAVÉS DEL MÉTODO ESTADÍSTICO Y LA
                      REGRESIÓN LINEAL

REGRESIÓN




                 CONSISTENTE DE REGRESIÓN




                    ECUACIÓN MÁTEMATICA
EJERCICIO PROPUESTO

Resolver los siguientes ejercicios:

                                      X        Y
           X            Y
                                          63       56
                159.2       167.15
                                          60       60
                206.3           95
                                          57       61
               188.07        197.5
                                          58       60
                196.7        215.3
                                          79       65
                143.9        145.7
                                          55       62
                324.5        154.9
                                          57       58
                248.3        153.5
                                          58       61
                199.2        156.6
                                          65       56
                110.2        178.2
                                          73       65
                169.7        210.9
                                          66       69
                174.5        215.3
                                          63       59
                                          70       66
                                          65       60
                                          61       67
REGRESIÓN LINEAL




Es una relación entre 2 variables y utiliza un conjunto de datos
básicos. La regresión se centra en el uso de la relación para
determinar una predicción.



                                FÓRMULA




        = Valor predicho

      by = Pendiente
                       APRENDIZAJE MEDIDO
      ay = Ordenado al origen
Estadística inferencial maricela ayala
Estadística inferencial maricela ayala

Mais conteúdo relacionado

Mais procurados

Introducción a las ecuaciones diferenciales
Introducción a las ecuaciones diferencialesIntroducción a las ecuaciones diferenciales
Introducción a las ecuaciones diferencialesRuben Dario Lara Escobar
 
Ecuaciones Diferenciales de Primer Orden
Ecuaciones Diferenciales de Primer OrdenEcuaciones Diferenciales de Primer Orden
Ecuaciones Diferenciales de Primer Ordennildabfce
 
Ecuaciones y desigualdades
Ecuaciones y desigualdadesEcuaciones y desigualdades
Ecuaciones y desigualdadesCalhin Calhin
 
Programa Introducción a las Ecuaciones diferenciales Ordinarias 2015
Programa Introducción a las Ecuaciones diferenciales Ordinarias 2015Programa Introducción a las Ecuaciones diferenciales Ordinarias 2015
Programa Introducción a las Ecuaciones diferenciales Ordinarias 2015Yerikson Huz
 
Nociones de las Ec. dif. Ord
Nociones de las Ec. dif. OrdNociones de las Ec. dif. Ord
Nociones de las Ec. dif. OrdYerikson Huz
 
Unidad 2 MATEMÁTICA UNEFA
Unidad 2  MATEMÁTICA UNEFAUnidad 2  MATEMÁTICA UNEFA
Unidad 2 MATEMÁTICA UNEFAJose cedeño
 
Matemática II - Ecuaciones diferenciales
Matemática II - Ecuaciones diferencialesMatemática II - Ecuaciones diferenciales
Matemática II - Ecuaciones diferencialesJoe Arroyo Suárez
 
Unidad3 e
Unidad3 eUnidad3 e
Unidad3 esiris83
 
P03 Metodo Gauss
P03 Metodo GaussP03 Metodo Gauss
P03 Metodo GaussSaúl Qc
 
Diseños factoriales 2016
Diseños factoriales 2016Diseños factoriales 2016
Diseños factoriales 2016Petete Yeyo
 

Mais procurados (17)

Resumen matematicas_primer interciclo
Resumen matematicas_primer intercicloResumen matematicas_primer interciclo
Resumen matematicas_primer interciclo
 
Introducción a las ecuaciones diferenciales
Introducción a las ecuaciones diferencialesIntroducción a las ecuaciones diferenciales
Introducción a las ecuaciones diferenciales
 
Ecuaciones Diferenciales de Primer Orden
Ecuaciones Diferenciales de Primer OrdenEcuaciones Diferenciales de Primer Orden
Ecuaciones Diferenciales de Primer Orden
 
Ecuac diferenciales
Ecuac diferencialesEcuac diferenciales
Ecuac diferenciales
 
Ecuaciones diferenciales
Ecuaciones diferencialesEcuaciones diferenciales
Ecuaciones diferenciales
 
Ecuaciones y desigualdades
Ecuaciones y desigualdadesEcuaciones y desigualdades
Ecuaciones y desigualdades
 
Programa Introducción a las Ecuaciones diferenciales Ordinarias 2015
Programa Introducción a las Ecuaciones diferenciales Ordinarias 2015Programa Introducción a las Ecuaciones diferenciales Ordinarias 2015
Programa Introducción a las Ecuaciones diferenciales Ordinarias 2015
 
Correlacion lineal
Correlacion linealCorrelacion lineal
Correlacion lineal
 
Apuntes de ecuaciones
Apuntes de ecuacionesApuntes de ecuaciones
Apuntes de ecuaciones
 
Nociones de las Ec. dif. Ord
Nociones de las Ec. dif. OrdNociones de las Ec. dif. Ord
Nociones de las Ec. dif. Ord
 
Unidad 2 MATEMÁTICA UNEFA
Unidad 2  MATEMÁTICA UNEFAUnidad 2  MATEMÁTICA UNEFA
Unidad 2 MATEMÁTICA UNEFA
 
Guía 10
Guía 10Guía 10
Guía 10
 
15 aplicats classem
15 aplicats classem15 aplicats classem
15 aplicats classem
 
Matemática II - Ecuaciones diferenciales
Matemática II - Ecuaciones diferencialesMatemática II - Ecuaciones diferenciales
Matemática II - Ecuaciones diferenciales
 
Unidad3 e
Unidad3 eUnidad3 e
Unidad3 e
 
P03 Metodo Gauss
P03 Metodo GaussP03 Metodo Gauss
P03 Metodo Gauss
 
Diseños factoriales 2016
Diseños factoriales 2016Diseños factoriales 2016
Diseños factoriales 2016
 

Semelhante a Estadística inferencial maricela ayala

Semelhante a Estadística inferencial maricela ayala (20)

Portafolios de estadística inferencial maría
Portafolios de estadística inferencial maríaPortafolios de estadística inferencial maría
Portafolios de estadística inferencial maría
 
Tarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión linealTarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión lineal
 
Correlación
CorrelaciónCorrelación
Correlación
 
CONCORDANCIA Y CORRELACIÓN.
CONCORDANCIA Y CORRELACIÓN.CONCORDANCIA Y CORRELACIÓN.
CONCORDANCIA Y CORRELACIÓN.
 
Seminario10
Seminario10Seminario10
Seminario10
 
Pruebasdebondaddeajuste 151127221517-lva1-app6891
Pruebasdebondaddeajuste 151127221517-lva1-app6891Pruebasdebondaddeajuste 151127221517-lva1-app6891
Pruebasdebondaddeajuste 151127221517-lva1-app6891
 
Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajuste
 
Seminario 10
Seminario 10 Seminario 10
Seminario 10
 
Seminario 10 diapo
Seminario 10 diapoSeminario 10 diapo
Seminario 10 diapo
 
Seminario 10 diapo
Seminario 10 diapoSeminario 10 diapo
Seminario 10 diapo
 
Correlacion
CorrelacionCorrelacion
Correlacion
 
Exposición trabajo de spss
Exposición trabajo de spssExposición trabajo de spss
Exposición trabajo de spss
 
Exposicion
ExposicionExposicion
Exposicion
 
Correlación y regresión empleando excel y graph
Correlación y regresión empleando excel y graphCorrelación y regresión empleando excel y graph
Correlación y regresión empleando excel y graph
 
ESTADISTICA CHI CUADRADO.pptx
ESTADISTICA CHI CUADRADO.pptxESTADISTICA CHI CUADRADO.pptx
ESTADISTICA CHI CUADRADO.pptx
 
Seminario 10
Seminario 10Seminario 10
Seminario 10
 
Trabajo de spss
Trabajo de spssTrabajo de spss
Trabajo de spss
 
Seminario 10
Seminario 10Seminario 10
Seminario 10
 
Seminario 10
Seminario 10Seminario 10
Seminario 10
 
Seminario 10 diapo pdf
Seminario 10 diapo pdfSeminario 10 diapo pdf
Seminario 10 diapo pdf
 

Mais de Maricela Ayala

EJERCICIO DE ÁRBOL DE DECISION
EJERCICIO  DE  ÁRBOL  DE DECISION EJERCICIO  DE  ÁRBOL  DE DECISION
EJERCICIO DE ÁRBOL DE DECISION Maricela Ayala
 
Proyecto de estadística inferencial con aplicación a spss123
Proyecto de estadística inferencial con aplicación a spss123Proyecto de estadística inferencial con aplicación a spss123
Proyecto de estadística inferencial con aplicación a spss123Maricela Ayala
 
Actividad 1. maricela ayala
Actividad 1. maricela ayalaActividad 1. maricela ayala
Actividad 1. maricela ayalaMaricela Ayala
 
Cuestionario de finanzas internacionales maricela
Cuestionario de finanzas internacionales maricelaCuestionario de finanzas internacionales maricela
Cuestionario de finanzas internacionales maricelaMaricela Ayala
 
Contabando y defraudaci__maricela[1]
Contabando y defraudaci__maricela[1]Contabando y defraudaci__maricela[1]
Contabando y defraudaci__maricela[1]Maricela Ayala
 
Ejercicios de estadistica
Ejercicios  de estadisticaEjercicios  de estadistica
Ejercicios de estadisticaMaricela Ayala
 
Relacion lineal maricela ayala
Relacion lineal maricela ayalaRelacion lineal maricela ayala
Relacion lineal maricela ayalaMaricela Ayala
 
G20 página de internet
G20 página de internetG20 página de internet
G20 página de internetMaricela Ayala
 

Mais de Maricela Ayala (20)

EJERCICIO DE ÁRBOL DE DECISION
EJERCICIO  DE  ÁRBOL  DE DECISION EJERCICIO  DE  ÁRBOL  DE DECISION
EJERCICIO DE ÁRBOL DE DECISION
 
Empresa chicha fresh
Empresa chicha   freshEmpresa chicha   fresh
Empresa chicha fresh
 
Proyecto de estadística inferencial con aplicación a spss123
Proyecto de estadística inferencial con aplicación a spss123Proyecto de estadística inferencial con aplicación a spss123
Proyecto de estadística inferencial con aplicación a spss123
 
Chi cuadrado
Chi  cuadradoChi  cuadrado
Chi cuadrado
 
Actividad 6
Actividad 6Actividad 6
Actividad 6
 
Actividad 4
Actividad 4Actividad 4
Actividad 4
 
Actividad 1. maricela ayala
Actividad 1. maricela ayalaActividad 1. maricela ayala
Actividad 1. maricela ayala
 
Cuestionario de finanzas internacionales maricela
Cuestionario de finanzas internacionales maricelaCuestionario de finanzas internacionales maricela
Cuestionario de finanzas internacionales maricela
 
Comercio ilegal
Comercio ilegalComercio ilegal
Comercio ilegal
 
Empresas monopolicas
Empresas monopolicasEmpresas monopolicas
Empresas monopolicas
 
Contabando y defraudaci__maricela[1]
Contabando y defraudaci__maricela[1]Contabando y defraudaci__maricela[1]
Contabando y defraudaci__maricela[1]
 
ùLtimas resoluciones
ùLtimas resolucionesùLtimas resoluciones
ùLtimas resoluciones
 
Ejercicios de estadistica
Ejercicios  de estadisticaEjercicios  de estadistica
Ejercicios de estadistica
 
Conceptos
ConceptosConceptos
Conceptos
 
Hipotesis maricela
Hipotesis maricelaHipotesis maricela
Hipotesis maricela
 
Relacion lineal maricela ayala
Relacion lineal maricela ayalaRelacion lineal maricela ayala
Relacion lineal maricela ayala
 
G20 maricela ayala
G20 maricela ayalaG20 maricela ayala
G20 maricela ayala
 
Maricela ayala
Maricela ayalaMaricela ayala
Maricela ayala
 
G20 página de internet
G20 página de internetG20 página de internet
G20 página de internet
 
Fase 3
Fase 3Fase 3
Fase 3
 

Estadística inferencial maricela ayala

  • 1. UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL ESTADISTICA DESCRIPTIVA MCS : JORGE POZO PORTAFOLIO DEL DOCENTE MARICELA AYALA MARZO 2012 – AGOSTO 2012 Tulcán – Ecuador 2012
  • 2. ´ CORRELACIÓN TÉCNICAS DE CORRELACIÓN En los capítulos anteriores, ustedes estudiaron las distribuciones de una sola variable. A continuación abordaremos el estudio de dos variables y no solamente de una. Particularmente estudiaremos qué sentido tiene afirmar que dos variables están relacionadas linealmente entre sí y cómo podemos medir esta relación lineal. RELACIONES LINEALES ENTRE VARIABLES Supongamos que disponemos de dos pruebas una de ellas una prueba de habilidad mental y la otra una prueba de ingreso a la Universidad. Seleccionemos cinco estudiantes y presentamos en la tabla Nº4.1.1, los puntajes obtenidos en estas dos pruebas. TABLA Nº4.1.1 X PRUEBA Y ESTUDIANTES DE EXAMEN DE ADMISIÓN HABILIDAD MENTAL María 18 82 Olga 15 68 Susana 12 60 Aldo 9 32 Juan 3 18 Observamos las cinco parejas de puntajes de la tabla Nº4.1.1 ¿podemos afirmar que la prueba de habilidad mental se puede usar para pronosticar el puntaje de examen de admisión?. La tabla nos dice que si podemos hacer tal suposición ya que los estudiantes con puntajes altos en la prueba de habilidad mental tienen también un puntaje alto en el examen de admisión y los
  • 3. estudiantes con puntajes bajos en la prueba de habilidad mental, tienen puntajes bajos en el examen de admisión. En circunstancias como la presente (cuando los puntajes altos de una variable están relacionados con los puntajes altos de la otra variable y los puntajes bajos de una variable están relacionados con los puntajes bajos de la otra variable), afirmamos que hay una relación lineal positiva entre las dos variables, entonces podemos definir una relación lineal positiva entre ese conjunto de pares de valores X y Y, tal como se muestra en la tabla Nº4.1.1. Supongamos que en lugar de los resultados de la tabla Nº 4.1.1, hubiéramos obtenido los puntajes que se muestran en la tabla Nº 4.1.2 ¿Podríamos afirmar que en esta situación los puntajes de la prueba de habilidad mental pueden usarse para pronosticar los puntajes altos en el test de habilidad mental aparecen con puntajes bajos en el examen de admisión y los sujetos con puntajes altos en el examen de admisión, entonces podemos definir una relación lineal negativa entre un conjunto de pares de valores X y Y (tal como en la tabla Nº4.1.2), es decir, los puntajes altos de X están apareados con los puntajes bajos de Y y los puntajes bajos de X están apareados con los puntajes altos de Y. TABLA Nº4.1.2 X Y PRUEBA DE ESTUDIANTES EXAMEN DE ADMISIÓN HABILIDAD MENTAL María 18 18 Olga 15 32 Susana 12 60 Aldo 9 68 Juan 3 82 TABLA Nº4.1.3
  • 4. X Y PRUEBA DE ESTUDIANTES EXAMEN DE ADMISIÓN HABILIDAD MENTAL María 18 18 Olga 15 82 Susana 12 68 Aldo 9 60 Juan 3 32 Examinemos ahora la tabla Nº4.1.3. en este caso ya no podemos afirmar que los puntajes de la prueba de habilidad mental sirvan para pronosticar los puntajes del examen de admisión, ya que unos puntajes altos del test de habilidad mental están aparejados con otros puntajes bajos del examen de admisión y algunos puntajes bajos del test de habilidad mental están apareados con otros puntajes altos del examen de admisión, entonces, en este caso, decimos que no existe una relación lineal entre las variables X y Y. DIAGRAMA DE DISPERSIÓN En las situaciones que se presentan en la vida real no tenemos solamente cinco parejas de valores para ambas variables, sino muchísimas parejas. Otra forma alternativa de ver si existe o no relación lineal entre dos variables sería hacer una gráfica de los valores X y Y en un sistema de coordenadas rectangulares, este tipo de gráfica es conocido con el nombre de diagrama de dispersión, gráfico de dispersión o nube de puntos. Dibujemos el diagrama que corresponde a la tabla Nº4.1.1. lo haremos haciendo corresponder a cada valor de la variable independiente X, un valor de la variable dependiente Y, es decir, para la alumna Susana haremos corresponder su puntaje en la prueba de habilidad mental (12) con su puntaje de la prueba de admisión (60); al alumno Juan le hacemos corresponder su puntaje del test de habilidad mental (3) con su puntaje del examen de admisión (18). Luego ubicaremos los cinco pares de
  • 5. puntajes en el sistema de ejes rectangulares y obtendremos los gráficos Nº4.1.1 y Nº4.1.2. Observaremos en el gráfico Nº4.1.1, que tabla Nº4.1.1, es descrita por el diagrama de dispersión. Vemos en este gráfico que los cinco puntos dan la sensación de ascender en línea recta de izquierda a derecha. Esto es característico en datos en los que existe una relación lineal positiva. Aunque estos cinco datos no configuren una línea recta en forma perfecta, se puede trazar una línea recta que describa en estos puntos en forma bastante aproximada, conforme se ve en el gráfico Nº4.1.2 y por esto decimos que la relación es lineal. Si ocurre que todos los puntos de la gráfica de dispersión están incluidos en una sola línea en forma exacta afirmamos que la relación lineal es perfecta. El grado en que se separan los puntos de una sola línea recta nos da el grado en que la relación lineal no es perfecta. Así cuando menos puntos se encuentran en una sola línea decimos que la relación lineal entre las dos variables es menos fuerte y cuando más puntos queden incluidos en una línea recta afirmaremos que la relación lineal es más fuerte. GRÁFICO Nº4.1.1.
  • 6. GRÁFICO Nº4.1.2 Usando los datos de la tabla Nº4.1.2 y utilizando la misma forma de razonar empleada hasta ahora podemos construir el correspondiente gráfico de dispersión, tal como se muestra en el gráfico Nº4.1.3. Podemos observar en el gráfico Nº4.1.4 que la nube de puntos de la gráfica puede delinearse bien por una línea recta, lo que nos indica que hay una relación lineal entre las dos variables X y Y. vemos también que la línea desciende de izquierda a derecha (tienen pendiente negativa) por lo que decimos que la relación lineal entre las dos variables es negativa.
  • 7. Si tenemos en cuenta la tabla Nº4.1.3 podemos obtener una figura como se muestra en la gráfica Nº4.1.5. Notamos, en esta situación, que resultará inútil cualquier línea recta que trate describir adecuadamente este diagrama de dispersión. GRÁFICO Nº4.1.3 GRÁFICO Nº4.1.4
  • 8. GRÁFICO Nº4.1.5 COEFICIENTE DE CORRELACIÓN RECTILINEA DE PEARSON Con ayuda de las gráficas nos podemos formar una idea si la nube de puntos, o diagrama de dispersión, representa una relación lineal y si esta relación lineal
  • 9. es positiva o negativa, pero con la sola observación de la gráfica no podemos cuantificar la fuerza de la relación, lo que si conseguiremos haciendo uso del coeficiente r de Pearson. El coeficiente de correlación r de Pearson, forma valores comprendidos entre -1 y +1 pasando por 0. El número -1 corresponde a una correlación negativa perfecta (los puntos del diagrama de dispersión deben encontrarse formando perfectamente una línea recta). El coeficiente de correlación r=0 se obtiene cuando no existe ninguna correlación entre las variables. Los valores negativos mayores que -1 indican una correlación negativa y los valores positivos menores que 1 indican una correlación positiva. Referente a la magnitud de r podemos decir que independientemente del signo, cuando el valor absoluto de r esté más cerca de uno, mayor es la fuerza de la correlación, as así que -0.20 y +0.20 son iguales en fuerza (ambos son dos valores fuertes). CÁLCULO DEL COEFICIENTE r DE PEARSON UTILIZANDO UNA MÁQUINA CALCULADORA CUANDO LOS DATOS NO SON MUY NUMEROSOS Dadas dos variables X y Y con sus respectivos valores. Tabla Nº4.1.4, podemos calcular el coeficiente r de Pearson con una máquina calculadora mediana la siguiente fórmula. TABLA AUXILIAR Nº4.1.4. (1) (2) (3) (4) (5) x Y x2 y² XY
  • 10. 18 82 324 6724 1476 15 68 225 4624 1020 12 60 144 3600 7200 9 32 81 1024 288 3 18 9 324 54 ∑x = 57 ∑y= 260 ∑x² = 783 ∑y² = 16296 ∑xy = 3558 Con los datos de la tabla Nº4.1.1, se ha elaborado la Tabla Auxiliar Nº4.1.4. En las columnas (1) y (2) se han escrito los valores de X y Y. en la columna (3), se han elevado al cuadrado los valores de X. en la columna (4) se han elevado al cuadrado los valores de Y. en la columna (5) se ha efectuado el producto de cada pareja de valores X y Y. aplicando los datos en la fórmula 4.1.1, se tiene: INTERPRETACIONES DE UN COEFICIENTE DE CORRELACIÓN
  • 11. ¿Qué tan elevado es un coeficiente de correlación dado?. Todo coeficiente de correlación que no sea cero indica cierto grado de relación entre dos variables. Pero es necesario examinar más esta materia, porque el grado de intensidad de relación se puede considerar desde varios puntos de vista. No se puede decir que un r de 0.50 indique una relación dos veces más fuerte que la indicada por r de 0.25. ni se puede decir tampoco que un aumento en la correlación de r=0.40 a r=0.60 equivalga a un aumento de r=0.70 a r=0.90. es de observar que una correlación de -0.60 indica una relación tan estrecha como una correlación de +0.60, la relación difiere en la dirección. Siempre que esté establecida fuera de toda duda razonable una relación entre dos variables, el que el coeficiente de correlación sea pequeño puede significar únicamente que la situación medida está contaminada por algún factor o factores no controlados. Es fácil concebir una situación experimental en la cual, si se han mantenido constantes todos los factores que no sean pertinentes, el r podría haber sido 1 en lugar de 0.20. por ejemplo: generalmente la correlación entre la puntuación de aptitud y el aprovechamiento académico es 0.50 puesto que ambos se miden en una población cuyo aprovechamiento académico también es influenciable por el esfuerzo, las actitudes, las peculiaridades de calificación de los profesores, etc. Si se mantuvieran constantes todos los demás factores determinantes del aprovechamiento y se midieran exactamente la aptitud y las notas, el r sería 1 en vez de 0.50. Una conclusión práctica a la correlación es que ésta es siempre relativa a la situación dentro de la cual se obtiene y su magnitud no representa ningún hecho natural absoluto. El coeficiente de correlación es siempre algo puramente relativo a las circunstancias en que se ha obtenido y se ha de interpretar a la luz de esas circunstancias y sólo muy rara vez en algún sentido absoluto.
  • 12. Además podemos agregar que la interpretación de un coeficiente de correlación como medida del grado de relación lineal entre dos variables, es una interpretación como medida del grado de relación lineal entre dos variables, es una interpretación matemática pura y está completamente desprovista de implicaciones de causa y efecto. El hecho de que dos variables tiendan a aumentar o disminuir al mismo tiempo no implica que obligadamente una tenga algún efecto directo o indirecto sobre la otra. A continuación calcularemos con la fórmula Nº4.1.1, antes indicada coeficiente de Pearson de la relación presentada en la tabla Nº4.1.2 CUADRO AUXILIAR 4.1.5 (1) (2) (3) (4) (5) x Y x2 y² XY 18 18 324 324 324 15 32 225 1024 480 12 60 144 3600 720 9 68 81 4624 612 3 82 9 6724 246 ∑xy = ∑x = 57 ∑y= 260 ∑x² = 783 ∑y² = 16296 2382
  • 13. Vemos que la correlación es fuerte y negativa. Ahora calculemos con la misma fórmula de Pearson Nº4.1.1, el Coeficiente de Correlación lineal con los datos de la tabla Nº4.1.3. CUADRO AUXILIAR 4.1.6 (1) (2) (3) (4) (5) x Y x2 y² XY 18 18 324 324 324 15 32 225 6724 1230 12 60 144 4624 816 9 68 81 3600 542 3 82 9 1024 96 ∑x = 57 ∑y= 260 ∑x² = 783 ∑y² = 16296 ∑xy = 3006
  • 14. La correlación es muy débil y positiva. CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN CLASES El presente tema nos conduce a calcular el coeficiente de correlación r, que nos proporciona información de la fuerza de la relación que existe entre dos conjuntos de datos que se encuentran agrupados, cada uno de ellos formando por separados una distribución de frecuencias, mejor dicho teniendo por separado sus intervalos de clase con sus respectivas frecuencias. Para realizar una exposición del tema en forma más entendible, presentamos el ejemplo del Cuadro Nº 4.1.7. Ejemplo: Calcular el grado de correlación entre las puntaciones obtenidas en inventario de hábitos de estudio y los puntajes obtenidos en un examen de Matemática, aplicados a un total de 134 alumnos de un colegio de la localidad. CUADRO Nº 4.1.7 X Hábitos de estudio
  • 15. 20 30 30 40 40 50 50 60 Total Y Matemática 70 80 3 2 2 7 60 70 1 0 4 5 10 50 60 2 6 16 3 27 40 50 4 14 19 10 47 30 40 7 15 6 0 28 20 30 8 2 0 1 11 10 20 1 1 2 4 Total 23 40 48 23 134 Podemos notar que el problema no es tan simple, como el caso anterior, dado que ahora los datos se han clasificado en una tabla de doble entrada Nº 4.1.7. Este cuadro muestra, en la primera columna del lado izquierdo los intervalos de clase de la variable Y, los que cubren todos los posibles datos acerca de las puntuaciones alcanzadas por los estudiantes en la prueba de Matemática. Nótese que los intervalos crecen de abajo hacia arriba. En la fila superior se presentan los intervalos de clase todos los 134 posibles datos acerca de los puntajes obtenidos por los estudiantes en la variable hábitos de estudios representados por la letra X. Dentro del Cuadro Nº 4.1.7 en los casilleros interiores o celdas de la tabla, se encuentran las frecuencias de celdas que corresponden a puntajes que pertenecen tanto a un intervalo de la variable Y como a un intervalo de la variable X. En la fila interior del Cuadro se presentan los totales de los puntajes de la variable X, hábitos de estudio. Esos totales se llaman frecuencias marginales de la variable X y se representan por .
  • 16. En la última columna de la derecha se encuentran los totales de los puntajes de la variable rendimiento en matemática. Estos totales se denominan frecuencias marginales de la variable Y. Cuando los datos se presentan tal como el presente caso, formando tablas de doble entrada, es conveniente usar el método clave que expondremos a continuación porque con este procedimiento se evita manejar grandes números, como sería el caso si se emplearán las fórmulas para trabajar con la calculadora de bolsillo. La fórmula que utilizaremos es la siguiente: Para obtener los datos que deben aplicarse en la fórmula Nº 4.1.2., vamos a construir el cuadro auxiliar Nº 4.1.8, al mismo tiempo que se explica el significado de los símbolos de esa fórmula. Lo primero que hacemos es reemplazar los intervalos horizontales y verticales por sus respectivas marcas de clase; a continuación adicionaremos al Cuadro Nº 4.1.7, cinco columnas por el lado derecho; cuyos encabezamientos son: para la primera para la segunda, para la tercera, para la cuarta y para la quinta columna. Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran: para la primera para la segunda fila que está debajo de la anterior, para la tercera fila y por último, para la cuarta fila que está debajo de todas; de esta manera se va elaborando el Cuadro Auxiliar Nº 4.1.8. 1) Para determinar las frecuencias marginales que se deben colocar en la columna para la primera para la segunda, para la tercera,
  • 17. sumamos las frecuencias de las celdas que están en la misma fila de la marca de clase 75, obtenemos: 3+2+2=7, número que se escribe en el primer casillero o celda de la columna para la primera para la segunda, para la tercera, En la fila de la marca de clase 65, sumamos 1+4+5=10, número que se escribe debajo del 7. Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27. Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47. En igual forma: 7+15+6=28. Lo mismo: 8+2+1=11 Y en la última fila: 1+1+2=4 A continuación sumamos estas frecuencias marginales de la variable Y: 7+10+27+47+28+11+4=134 es el total general. 2) Ahora a determinar las frecuencias marginales de la variable X: En columna encabezada con la marca de clase 25 sumemos verticalmente las frecuencias: 1+2+4+7+8+1=23. En la columna encabezada con 35, tenemos: 3+6+14+15+2=40 En la siguiente: 2+4+16+19+6+1=48 En la última: 2+5+3+10+1+2=23 3) Centremos nuestra atención en la columna encabezada para la primera para la segunda, para la tercera, este signo significa desviación unitaria, y procedemos en la misma forma que en las Tablas Nº 2.1.2 y Nº 2.1.3 (b). recuerden que las desviaciones unitarias positivas: +1, +2, y +3 corresponden a los intervalos mayores y por el contrario las desviaciones unitarias negativas: -1, -2 y -3 corresponden a los intervalos menores. Como origen de trabajo se tomó la marca de clase 45 y por lo tanto su desviación unitaria es cero. 4) Luego vamos a determinar las desviaciones unitarias horizontales de la variable X. el origen de trabajo es la marca de clase 45 que se halla en la fila
  • 18. superior del cuadro, por esa razón, escribimos cero debajo de la frecuencia marginal 48. Las desviaciones unitarias negativas: -1 y -2 se escriben a la izquierda cero, porque se corresponden con los intervalos de clase que tienen menores marcas de clase y que están a la izquierda de 45. La desviación unitaria positiva, se corresponde con el intervalo de mayor marca de clase, 55 (en parte superior del Cuadro Nº 4.1.8.) 5) A continuación vamos a determinar los valores que deben colocarse en la columna encabezada ; este símbolo indica que se debe multiplicar cada valor de por su correspondiente valor de , así: 7(+3)=21; 10(+2)=20; 27(+1)=27; 47(0)=0; 28(-1)=-28; 11(-2)=-22 y 4(-3)=-12. Sumando algebraicamente, tenemos: 21+20+27=68 los positivos: y (-28)+ (-22)+ (-12)=-62 los negativos. Por último: 68-62=6 total, que se coloca en la parte inferior de la columna Para obtener los valores de la cuarta columna encabezada debemos tener en cuenta que ( , por lo tanto basta multiplicar cada valor de la segunda columna por su correspondiente valor de la tercera columna así se obtiene el respectivo valor de la cuarta columna. En efecto: (+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-3)(- 12)=36 La suma: 63+40+27+28+44+36=238 Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que ( = por consiguiente basta multiplicar verticalmente un valor de la primera fila por su correspondiente valor de la segunda dila para obtener el respectivo valor de la tercera fila.
  • 19. (23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23 Sumando horizontalmente: (-46)+ (-40)+ (23)=-86+23=-63 Vamos por la cuarta fila; vemos que . Luego basta multiplicar cada elemento de la segunda fila por su correspondiente elemento de la tercera fila para obtener el respectivo elemento de la cuarta fila así: (-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23 Para obtener los valores de la quinta columna observamos que hay tres factores; el 1º es la frecuencia de la celda o casillero que se está considerando, el segundo factor es la desviación unitaria , el tercer factor es la desviación unitaria . Por tanto el procedimiento será el siguiente: Tomemos el número 3 que es la frecuencia de la celda determinada por el cruce de los intervalos que tienen la marcha de clase 75 horizontalmente y 35 verticalmente. Bajemos la vista del número 3 hacia donde se halla el respectivo valor (-1) de la desviación unitaria (ver la línea punteada). Para indicar el tercer factor corremos la vista del número 3 hacia su derecha hasta llegar a la columna de las desviaciones unitarias y ubicamos el número +3 (ver la línea punteada) formemos el producto de estos tres números: (3) (-1) (+3)=-9. Este número -9 encerrado en un semicírculo lo escribimos en la celda elegida.
  • 20. En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0 Continuando hacia la derecha: (2) (+1) (+3)=6 CUADRO AUXILIAR Nº 4.1.8
  • 21. CUADRO CORREGIDO DEL CUADRO AUXILIAR Nº 4.1.8 La fórmula del paso (9) lleva el signo para indicar que se deben sumar horizontalmente los números que están encerrados en los semicírculos de esa primera fila elegida, así: -9+0+6=-3. Este número se escribe en la quinta columna. Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un semicírculo. (0)(-1)(+2)=0 (4)(0)8+2)=0 (5)(+1)(+2)=10
  • 22. Sumando 0+0+10=10 Ahora con la tercera fila: (2)(-2)(+1)=-4 (6)(-1)(+1)=-6 (16)(0)(+1)=0 (3)(+1)(+1)=3 Sumando: (-4)+(-6)+0+3=-7 Cuarta fila: (7)(-2)(-1)=14 (15)(-1)(-1)=15 (6)(0)(-1)=0 (0)(+1)(-1)=0 La suma es: 14+15=29 (8)(-2)(-2)=32 (2)(-1)(-2)=4 (0)(0)(-2)=0 (1)(+1)(-2)=-2 La suma es: 32+4-2=34 Séptima fila: (1)(-2)(-3)=6 (1)(0)(-3)=-6
  • 23. (2)(1)(-3)=-6 Sumando: 6+0-6=0 Sumando los valores de la columna quinta. -3+6-7+0+29+34+0=69-10=59 Reuniendo los resultados anteriores, se tienen los datos para aplicar en fórmula Nº 4.1.2. n=134
  • 24. EJERCICIO RESUELTO Nº2 DE CÁLCULO DEL COEFICIENTE DE CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS Calcular el coeficiente de correlación lineal de las puntuaciones en matemáticas de 100 estudiantes de la Facultad de Ciencias de la Universidad MN. CUADRO Nº4.1.9
  • 25. CUADRO Nº4.1.10 En este problema tenemos que calcular el coeficiente de correlación lineal r para dos conjuntos de datos, constituidos por los calificativos en una escala de 0 a 100, en matemáticas y en física para 100 estudiantes de la Facultad de Ciencias de cierta Universidad. Los datos se muestran en el cuadro Nº4.1.9. Notemos que a lo largo de la línea horizontal superior se encuentran los intervalos que contienen los calificativos de matemáticas desde 40 hasta 100. Igualmente en la primera columna vertical izquierda, se encuentran los calificativos para física de los mismos estudiantes, desde el calificativo 40 hasta 100. Nótese que en la columna de los calificativos de física los datos crecen de
  • 26. abajo hacia arriba y para la fila horizontal superior vemos que los calificativos en matemáticas crecen de izquierda a derecha. A continuación procedemos a calcular el coeficiente de correlación r para estos datos aplicando el mismo método que utilizamos en el problema anterior. 1) Traslademos los datos del cuadro Nº4.1.9 al cuadro Nº4.1.10. llamaremos fxy a cualquiera de las frecuencias de los casilleros interiores del cuadro Nº4.1.9. en el cuadro Nº4.1.10 podemos observar que se han agregado cinco columnas por el lado derecho y cuatro filas por la parte inferior. Observaremos en el cuadro Nº4.1.10 que los intervalos para la puntuación en matemáticas y para la puntuación en física se han reemplazado por las marcas de clase correspondientes. Así en la fila horizontal superior se ha reemplazado el primer intervalo 4050 por su marca de clase 45, el segundo intervalo 5060 por su marca de clase 55 y de esta manera se han reemplazado los demás intervalos por sus marcas de clases en el cuadro Nº4.1.10. De igual forma para la columna primera de la izquierda vemos que los intervalos se han reemplazado por sus respectivas marcas de clase así, para la puntuación en física el primer intervalo superior 90 100 se han reemplazado por su marca de clase 95, el segundo intervalo superior 8090 se ha reemplazado por su marca de clase 85 y así sucesivamente hasta llegar el intervalo inferior 4050 que se ha reemplazado por su marca de clase 45. Ahora vamos a realizar los pasos siguientes:
  • 27. 1) Para determinar las frecuencias marginales sumemos todos los valores de la primera fila que tiene la marca de clase 95. De esta forma tenemos: 2+5+5=12. Para la segunda fila que corresponde a la marca de clase 85, obtenemos: 1+3+6+5=15 que escribimos en el segundo casillero de . Continuando con la suma de los números, de las filas llenamos la columna .. 2) Dediquemos nuestra atención a las frecuencias marginales . El primer resultado de lo obtenemos sumando las frecuencias para la columna que tiene la marca de clase 45, de esta forma tenemos: 2+4+4=10 que se escribe en el primer casillero de la fila . Para el segundo casillero tenemos el número 15 que se obtiene sumando verticalmente las frecuencias de la columna que tiene la marca de clase 55. Continuando con la suma de las de las demás columnas, llenamos las frecuencias marginales . 3) Atendamos ahora la columna . La columna tiene en total 6 casilleros arbitrariamente escogemos uno de estos casilleros como origen de trabajo le asignamos el número. Observemos ahora la primera columna de la izquierda en donde están las marcas de clase de los puntajes de física. Aquí observamos que las marcas de clase crecen de abajo hacia arriba, entonces las desviaciones unitarias en la columna crecerán de abajo hacia arriba. Entonces del 0 hacia abajo, las desviaciones unitarias son números negativos que van decreciendo hacia abajo. Desde el 0 hacia arriba las desviaciones unitarias serán positivas y crecientes. De manera que podemos observar que la columna está conformada por los siguientes números que crecen del cero hacia arriba: 1,2 y desde el cero hacia abajo decrecen: -1, -2, -3. 4) Veamos la fila
  • 28. Notamos que en la fila horizontal superior las marcas de clase crecen de izquierda a derecha, de igual forma las desviaciones unitarias crecerán de izquierda a derecha. Elegimos como origen de trabajo arbitrariamente uno de los casilleros de , el tercero contando de izquierda a derecha, y vamos asignando números positivos crecientes hacia la derecha del 0, así tenemos 1, 2 y 3 y hacia la izquierda, a partir del cero, tendremos: -1 y -2. 5) Expliquemos la columna multipliquemos cada valor de por su correspondiente valor de y se obtiene un valor . Por ejemplo el número 24 se obtiene multiplicando la frecuencia marginal por su correspondiente desviación unitaria esto es, 12x2=24. Para el segundo casillero multiplicamos 15x1=15; para el tercero 25x0=0, así hasta terminar con 11 x (-3)=-33. 6) Observamos la columna . La primera celda de esta columna tiene el número 48 que se obtiene multiplicando el valor de la segunda columna por su correspondiente valor =24, de la tercera columna, es decir, 2 x 24 = 48. Para el segundo casillero de la columna , tenemos 15 que es igual a 1 x 15. De esta forma continuamos llenando los demás valores de la columna . 7) Veamos ahora la fila . El número -20 del primer casillero de esta fila se obtiene multiplicando la frecuencia marginal por su correspondiente desviación unitaria , es decir: 10(-2)=-20. Para el segundo casillero de , multiplicamos (-1) x (-15) = 15 y así sucesivamente hasta 12 x 3 = 36. 8) Veamos la fila . El primer casillero de esta fila es 40 y es el resultado de multiplicar -2 del primer casillero de la fila por -20 de su correspondiente primer casillero de la fila esto es. (-2) x (-20) = 40. Para el segundo casillero de multiplicamos -1 del segundo casillero por -
  • 29. 15 de su correspondiente segundo casillero de , luego obtenemos (-1) x (-15) = 15. Así continuamos multiplicando los valores de los valores de los casilleros de la fila por sus correspondientes valores de la fila hasta llegar a (3) (36) =108. 9) Interesa ahora obtener los números encerrados en semicírculos, por ejemplo, el número 4, que corresponde a la marca de clase 75 para la puntuación en matemáticas y a la marca de clase 95 de la puntuación en física. Para saber cómo se obtiene este número 4, corramos nuestra vista hacia la derecha dirigiéndose hacia la columna y obtenemos el número 2. Del número 4, encerrado en semicírculo, bajemos la vista con dirección a la fila y obtenemos 1. La frecuencia del casillero donde está el 4, encerrado en semicírculo, es . Multiplicando estos tres factores tendremos: . Podemos enunciar la siguiente regla: Para obtener los valores encerrados en semicírculos en los casilleros interiores del cuadro Nº4.1.10, multiplicamos el valor de la frecuencia del casillero para la cual estamos haciendo el cálculo, por los valores de las desviaciones unitarias y , obtenidas corriendo la vista hacia la derecha hasta columna y también hacia abajo hasta llegar a la fila . Así por ejemplo, para el casillero que corresponde a las marcas de clase 75 en matemática y 85 en física, tenemos la frecuencia de la celda , los otros dos factores son: y =1. Luego (3) x (1) x (1) = 3 que es el valor encerrado en semicírculo.
  • 30. Para el casillero correspondiente a la marca de clase 55 en matemáticas marca de clase 45 en física, tenemos: , , que es el valor encerrado en semicírculo. Así podemos proceder para obtener todos los demás valores encerrados en semicírculos. Sumando las frecuencias marginales de la columna , se tiene . Sumando los valores de la tercera columna se obtiene . La suma de los valores de la quinta columna: =150 Para todas las filas, en el último casillero de la derecha se tiene la suma de los valores de la fila. Así por ejemplo. ; . Para la tercera fila: . Para la cuarta fila: Estos totales de filas y columnas reemplazamos en la fórmula Nº4.1.2.
  • 31. Vemos que el coeficiente de correlación en este caso es 0,79 EJERCICIO PROPUESTO Nº1 DEL CÁLCULO DEL COEFICIENTE DE CORRELACIÓN ENTRE DOS CONJUNTOS AGRUPADOS DE DATOS. Supongamos que tenemos 30 sujetos a los que hemos aplicado una prueba de conocimientos de Psicología General (variable x) y un test de inteligencia (variable y). los datos se muestran en el Cuadro Nº4.1.11. Aplicando los datos tomados del Cuadro Auxiliar Nº4.1.12 en la fórmula Nº4.1.2, tenemos: Resultado:
  • 32. REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL SIMPLE Al comenzar a estudiar las técnicas de correlación afirmamos que estudiaríamos dos variables y no solamente una. Llamamos en esa ocasión x a una de las variables y a la otra. En el tema que nos ocuparemos ahora, estudiaremos la forma tabla Nº4.2.1, similar a lo que utilizamos correlación, conocimiento el puntaje en la prueba de habilidad mental (variable x) para un alumno determinado, podemos anticipar el puntaje del examen de admisión (variable y) del mismo alumno. Consideramos la relación lineal expresada por el cuadro Nº4.2.1. si dibujamos esa relación, obtenemos el gráfico Nº4.2.1. como podemos observar todos los puntos se alinean “exactamente” en una sola línea recta lo que recibe el nombre de línea de regresión. Teniendo en cuenta esta línea, podemos predecir cualquiera de los valores de y conociendo el valor de x: Para x = 25, según la recta, corresponde y = 35, para x =20, corresponde y=30, etc. En este caso se trata de una correlación positiva perfecta cuyo coeficiente de correlación es +1. CUADRO Nº4.2.1 PRUEBA DE EXAMEN DE HABILIDAD MENTAL ADMISIÓN X Y Susana 5 15 Iván 10 20 Lourdes 15 25 Aldo 20 30 Juan 25 35 María 30 40 César 35 45 Olga 40 50
  • 33. Recordemos el gráfico Nº4.2.1 que dibujamos cuando estudiamos correlación, en este gráfico observamos el diagrama de dispersión “aproximado” por una línea recta, la recta es mejor “ajuste”, a los puntos del diagrama de dispersión, es decir, en la mejor medida procure dejar igual números de puntos del diagrama de dispersión por encima de ella que igual número de puntos de abajo, se llama línea de regresión. ECUACIÓN DE LA REGRESIÓN RECTILÍNEA La ecuación que describe la línea de regresión es. X-r En donde: Media de variable y en la muestra EJEMPLO PROPUESTO Nº2 DEL CÁLCULO DEL COEFICIENTE DE CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS Supongamos que se tienen 50 vendedores de cierta compañía. Estos vendedores durante un año 1985 han realizado ventas tal como lo muestra el cuadro Nº4.1.13, el que también muestra el número de años de experiencia que tienen como vendedores. Para dicho cuadro, se pide calcular el coeficiente de correlación lineal r.
  • 34. CUADRO Nº4.1.13 Tomando los datos obtenidos en el Cuadro Auxiliar Nº4,1,14 apliquemos en la fórmula Nº4.1.12, se tiene: Resultado:
  • 36. GRÁFICO Nº 4.2.1 = media de la variable X en la muestra. X = un valor de la variable X r = coeficiente de Pearson, de la correlación lineal entre las variables X y Y desviación estándar de Y en la muestra desviación estándar de X en la muestra valor Y resultante del cálculo de la fórmula. Veamos cómo podemos predecir los valores de Y a partir de los valores de X. Estudiemos el Cuadro Nº 4.2.1. Cómo el gráfico de este cuadro es una línea recta ascendente sabemos que su coeficiente de correlación de Pearson r=+1. Además tenemos los siguientes resultados:
  • 37. =22.5 11.46 11.46 =32.5 Estos resultados se pueden calcular a partir de los datos del cuadro Nº4.2.1. Apliquemos estos datos a la fórmula Nº4.2.1, obtenemos la siguiente expresión: X-(1) Simplificando términos obtenemos: Escojamos cualquier valor de X del Cuadro Nº4.2.1 por ejemplo para María X=30, reemplazando este valor en (b). Vemos en el Cuadro Nº4.2.1 el valor que corresponde a María efectivamente es 40. Es decir, podemos usar la ecuación Nº4.2.1 para predecir los valores de Y conociendo los valores de X. Esta fórmula de regresión se puede para dos variables X y Y, entre las cuales no es obligatorio que exista una correlación lineal perfecta, es decir, no es obligatorio que r para la correlación entre X y Y sea siempre igual a 1. Este valor de r para otras aplicaciones de la regresión, puede tomar cualquier valor distinto.
  • 38. EJERCICIO RESUELTOS DE REGRESIÓN LÑINEAL SIMPLE Al aplicar un test de inteligencia a una muestra representativa constituida por 800 alumnos, se obtuvo la puntuación media de 30,4 puntos, con la desviación estándar de 12.6 puntos. La edad media de la muestra fue de 14.5 años, con la desviación estándar de 3.2 años. El coeficiente de correlación lineal de Pearson entre la variable Y, edad de sujetos estudiados y la variables X, rendimiento mental de los mismos sujetos, fue r=0,89 Con estos datos se pide determinar la ecuación de regresión rectilínea de edad en base del puntaje del rendimiento mental. ¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de: 25 puntos ? Datos: = 14.5 3.2 12.6
  • 39. Aplicando estos datos en la fórmula Nº 4.2.1 se tiene: X-0.89 . Es la ecuación de regresión buscada Respuesta de la primera pregunta Segunda pregunta Tercera pregunta Cuarta pregunta
  • 40. Quinta pregunta Sexta pregunta RELACIONES La correlación se ocupa de establecer la magnitud y la dirección de las relaciones. Antes de profundizar en estos aspectos particulares de las relaciones, analizaremos algunas características generales de éstas, con las cuales podemos comprender mejor el material específico acerca de la correlación. RELACIONES LINEALES Para iniciar nuestro análisis de las relaciones, veamos una relación entre dos variables. La siguiente tabla muestra el salario mensual que percibieron cinco agentes ventas y el valor en dólares de la mercancía vendida por cada uno de ellos en ese mes.
  • 41. AGENTE VARIABLE X MERCANCÍA Y VARIABLE VENDIDA ($) SALARIO ($) 1 0 500 2 1000 900 3 2000 1300 4 3000 1700 5 4000 2100 Podemos analizar mejor la relación entre estas variables si trazamos una gráfica utilizando los valores X y Y, para cada agente de ventas, como los puntos de dicha gráfica. Él es una gráfica de dispersión o dispersigrama. Una gráfica de dispersión o dispersigrama es una gráfica de parejas de valores X y Y. La gráfica de dispersión para los datos de los agentes de ventas aparece en la figura 6.1. En relación con esta figura, vemos que todos los puntos caen sobre una línea recta. Cuando una línea recta describe la relación entre dos variables, se dice que esta relación lineal. Una relación lineal entre dos variables es aquella que puede representarse con la mejor exactitud mediante una línea recta. Observe que no todas las relaciones son lineales; algunas son curvilíneas. En este caso, al trazar una gráfica de dispersión para las variables X y Y, una línea curva ajusta mejor a los datos que una línea recta.
  • 42. CÁLCULO DE LA (r) DE PEARSON
  • 43. La ecuación para calcular la r de Pearson mediante datos: Donde es la suma de los productos de cada pareja de puntajes z. Para utilizar esta ecuación, primero hay que convertir cada dato en bruto en su valor transformado. Esto puede tardar mucho tiempo y crear errores de redondeo. Con algún álgebra, esta ecuación se puede transformar en una ecuación de cálculo que utilice datos en bruto: ECUACIÓN PARA EL CÁLCULO DE LA (r) DE PEARSON Dónde: es la suma de los productos de cada pareja X y Y, también se llama la suma de productos cruzados. La tabla 6.4 contiene algunos de los datos hipotéticos reunidos a partir de cinco sujetos. Datos hipotéticos para el cálculo de la r de Pearson
  • 44. TABLA 6.4 SUBJETIVO X Y XY A 1 2 1 4 2 B 3 5 9 25 15 C 4 3 16 9 12 D 6 7 36 49 42 E 7 5 49 25 35 TOTAL 21 22 111 112 106 Utilicemos estos datos para calcular la r de Pearson:
  • 45. es la suma de los productos cruzados; se determina multiplicando los datos X y Y para cada sujeto y luego sumando los productos resultantes. El cálculo de y de los otros términos aparece en la tabla 6.4. Al sustituir estos valores en la ecuación anterior, obtenemos. PROBLEMA DE PRÁCTICA 6.1 Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para su conveniencia, hemos reproducido estos datos en las primeras tres columnas de la tabla 6.5. En este ejemplo tenemos una relación lineal imperfecta y estemos interesados en calcular la magnitud y dirección de la relación mediante la r de Pearson. La solución también aparece en la tabla 6.5. IQ y el promedio de las calificaciones: cálculo de la r de Pearson
  • 46. TABLA 6.5 ESTUDIANTE IQX PROMEDIO NÚMERO DE DATOS Y 1 110 1.0 12,100 1.00 110.0 2 112 1.6 12,544 2.56 179.2 3 118 1.2 13,924 1.44 141.6 4 119 2.1 14,161 4.41 249.9 5 122 2.6 14,884 6.76 317.2 6 125 1.8 15,625 3.24 225.0 7 127 2.6 16,129 6.76 330.2 8 130 2.0 16,900 4.00 260.0 9 132 3.2 17,424 10.24 422.4 10 134 2.6 17,956 6.76 384.4 11 136 3.0 18,496 9.00 408.0 12 138 3.6 19,044 12.96 496.8 TOTAL 1503 27.3 189,187 69.13 3488.7
  • 47. PROBLEMA DE PRÁCTICA 6.2 Tratemos de resolver otro problema. ¿Se ha puesto a reflexionar si es verdad que los opuestos se atraen? Todos hemos estado ante parejas en las que sus miembros parecen ser muy diferentes entre sí. ¿Pero esto es lo usual? ¿Qué fomenta la atracción: las diferencias o las similitudes? Un psicólogo social abordó este problema pidiendo a 15 estudiantes que respondieran un cuestionario relacionado con un sus actitudes hacia una amplia gama de temas. Tiempo después les mostró las “actitudes” de un extraño hacia los mismos temas y les pidió que evaluaran su agrado o inclinación por el extraño y si, probablemente, disfrutarían el trabajar con él. En realidad, las “actitudes” del extraño fueron elaboradas por el experimentador y variaron de sujeto a sujeto, con respecto a la proporción de actitudes similares que hubo entre el extraño y el individuo que participó en el experimento. De esa manera, se obtuvieron datos, para cada sujeto a sus actitudes y la atracción que sintió hacia un extraño, basada en las actitudes de este último hacia los mismos temas. Si los iguales se atraen, entonces debería existir una relación directa entre la atracción hacia un extraño y la proporción de actitudes similares. Los datos se presentan en la tabla 6.6. Entre mayor sea la atracción, más alto será el puntaje. El puntaje de atracción máximo es de 14. Calcule el coeficiente de correlación r de Pearson * para determinar si existe una relación directa entre la similitud de actitudes y el grado de atracción.
  • 48. Datos y solución del problema de práctica 6.2 TABLA 6.6 ESTUDIANTE PROPORCIÓN DE ATRACCIÓN Y NÚMERO ACTITUDES SIMILARES X 1 0.30 8.9 0.090 79.21 2.670 2 0.44 9.3 0.194 86.49 4.092 3 0.67 9.6 0.449 92.16 6.432 4 0.00 6.2 0.000 38.44 0.000 5 0.50 8.8 0.250 77.44 4.400 6 0.15 8.1 0.022 65.61 1.215 7 0.58 9.5 0.336 90.25 5.510 8 0.32 7.1 0.102 50.41 2.272 9 0.72 11.0 0.518 121.00 7.920 10 1.00 11.7 1.000 136.89 11.700 11 0.87 11.5 0.757 132.25 10.005 12 0.09 7.3 0.008 53.29 0.657 13 0.82 10.0 0.672 100.00 8.200 14 0.64 10.0 0.410 100.00 6.400 15 0.24 7.5 0.058 56.25 1.800 TOTAL 7.34 136.5 4.866 1279.69 73.273
  • 49. Por lo tanto, con base en estos estudiantes, existe una relación muy fuerte entre las similitudes y las atracciones. Una segunda interpretación de la r de Pearson. La r de Pearson también se puede interpretar en términos de la variabilidad de Y explicada por medio de X. este punto de vista produce más información importante acerca de r y la relación entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se muestra una relación imperfecta entre X y Y. En este ejemplo, la variable X representa una competencia de ortografía y la variable Y la habilidad en la escritura de seis estudiantes de tercer grado. Suponga que queremos predecir la calificación en la escritura de María, la estudiante cuya calificación en ortografía es de 88. Si no hubiese una relación entre la escritura y la ortografía. EJERCICIOS DE APLICACIÓN 1. En un largo curso de introducción a la sociología, un profesor hace dos exámenes. El profesor quiere determinar si las calificaciones de los estudiantes en el segundo examen correlacionadas con las calificaciones del primero. Para facilitar la los, se elige una muestra de ocho estudiar calificaciones aparecen en la siguiente tabla.
  • 50. a. Construya una gráfica de dispersión para datos, utilizando la calificación del primer examen como la variable X. ¿Parece lineal la relación? b. Suponga que existe una relación lineal en calificaciones de los dos exámenes, calcule la r de Pearson. c. ¿Qué tan bien explican la relación, las calificaciones del segundo examen? 120 100 80 60 Series1 40 20 0 0 20 40 60 80 100
  • 51. 0,629531757 Se puede decir que es una relación Baja y positiva que los dos exámenes tienen entre si 2. Un investigador realiza un estudio de la relación entre el consumo de cigarros y las enfermedades determinan la cantidad de cigarros fumados
  • 52. diariamente y de días de ausencia en el trabajo dura último año debido a una enfermedad para 13 individuos en la compañía donde trabaja este investigador. Los datos aparecen en la tabla anexa. SUJETO CIGARROS DÍAS DE CONSUMIDOS AUSENCIA 1 0 1 2 0 3 3 0 8 4 10 10 5 13 4 6 20 14 7 27 5 8 35 6 9 35 12 10 44 16 11 53 10 12 60 16 a. Construya una gráfica de dispersión para estos datos: ¿Se ve una relación lineal? b. Calcule el valor de la r de Pearson. c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto disminuye el rango de ambas variables. Vuelva a calcular r para los sujetos restantes. ¿Qué afecto tiene la disminución del rango sobre r? d. A utilizar todo el conjunto de datos, ¿qué porcentaje de la variabilidad en el número de días de ausencia es explicado por la cantidad de cigarros fumados diariamente? ¿De qué sirve ese valor?
  • 53. 18 16 14 12 10 8 Series1 6 4 2 0 0 20 40 60 80
  • 54. 0,6753 16 14 12 10 8 6 Series1 4 2 0 0 10 20 30 40
  • 55. 0,0318 3. Un educador ha construido un examen para las aptitudes mecánicas y desea determinar si éste es confiable, mediante dos administraciones con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10 estudiantes reciben dos administraciones del examen, donde la segunda administración ocurre un mes después que la primera. Los datos aparecen en la tabla. a. Construya una gráfica de dispersión para las parejas de datos. b. Determine el valor de r. c. ¿Sería justo decir que éste es un examen confiable? Explique esto al utilizar . SUJETO ADMINISTRACIÓN 1 ADMINISTRACIÓN 2 1 10 10 2 12 15 3 20 17 4 25 25 5 27 32 6 35 37 7 43 40 8 40 38 9 32 30 10 47 49
  • 56. 60 50 40 30 Series1 20 10 0 0 20 40 60 0,9881
  • 57. La investigación no es confiable por que los datos son tomados en dos fecha totalmente distintas 4. Un grupo de investigadores ha diseñado un cuestionario sobre la tensión, consistente en 15 sucesos. Ellos están interesados en determinar si existe una coincidencia entre dos culturas acerca de la cantidad relativa de ajustes que acarrea cada suceso. El cuestionario se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe utilizar el evento “matrimonio” como estándar y juzgar los demás eventos en relación con el ajuste necesario para el matrimonio. El matrimonio recibe un valor arbitrario de 50 puntos. Si se considera que un evento requiere de más ajustes que el matrimonio, el evento debe recibir más de 50 puntos. El número de puntos excedentes depende de la cantidad de ajustes requeridos. Después de que cada sujeto de cada cultura ha asignado puntos a todos los eventos, se promedian los puntos de cada evento. Los resultados aparecen en la siguiente tabla:
  • 58. EVENTOS ESTADOUNIDENSES ITALIANOS Muerte de la esposa 100 80 Divorcio 73 95 Separación de la pareja 65 85 Temporada en prisión 63 52 Lesiones personales 53 72 Matrimonio 50 50 Despedido del trabajo 47 40 Jubilación 45 30 Embarazo 40 28 Dificultades sexuales 39 42 Reajustes económicos 39 36 Problemas con la familia política 29 41 Problemas con el jefe 23 35 Vacaciones 13 16 Navidad 12 10 a. Suponga que los datos tienen al menos una escala de intervalo y calcule la correlación entre los datos estadounidenses y la de los italianos. b. Suponga que los datos sólo tienen una escala ordinal y calcule la correlación entre los datos de ambas culturas.
  • 59. 100 80 60 40 Series1 20 0 0 50 100 150
  • 60. 0,8519 La r es alta y positiva es decir que los comportamiento de las dos nacionalidades son bastante similares INDIVIDUO EXÁMEN CON LÁPIZ SIQUIATRA SIQUIATRA Y PAPEL A B 1 48 12 9 2 37 11 12 3 30 4 5 4 45 7 8 5 31 10 11 6 24 8 7 7 28 3 4 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3 5. Un psicólogo ha construido un examen lápiz - papel, a fin de medir la depresión. Para comparar los datos del examen con los datos de los expertos, 12 individuos “con perturbaciones emocionales” realizan el
  • 61. examen lápiz – papel. Los individuos también son calificados de manera independiente por dos siquiatras, de acuerdo con el grado de depresión determinado por cada uno como resultado de entrevistas detalladas. Los datos aparecen a continuación. Los datos mayores corresponden a una mayor depresión. a. ¿Cuál es la correlación entre los datos de los dos siquiatras? b. ¿Cuál es la correlación entre las calificaciones del examen con lápiz y papel y los datos de cada siquiatra? 14 12 10 8 6 Series1 4 2 0 0 5 10 15
  • 62. 0,8519 La relación se da con un mismo criterio por los psiquiatras 14 12 10 8 6 Series1 4 2 0 0 20 40 60
  • 63. 0,6973 La relación entre las dos variables es baja y positiva
  • 64. 14 12 10 8 6 Series1 4 2 0 0 20 40 60 0,697
  • 65. 6. Para este problema, suponga que usted es un psicólogo que labora en el departamento de recursos humanos de una gran corporación. El presidente de la compañía acaba de hablar con usted acerca de la importancia de contratar personal productivo en la sección de manufactura de la empresa y le ha pedido que ayude a mejorar la capacidad de la institución para hacer esto. Existen 300 empleados en esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la corporación sólo ha recurrido a entrevistas para elegir a estos empleados. Usted busca bibliografía y descubre dos pruebas de desempeño, lápiz – papel, bien estandarizadas, y piensa que podrían estar relacionados con los requisitos desempeño de esta sección. Para determinar si alguna de ellas se puede utilizar como dispositivo de selección, elige 10 empleados representativos de la sección de manufactura, garantizando que un amplio rango de desempeño quede representado en la muestra, y realiza las dos pruebas con cada empleado. Los datos aparecen en la siguiente tabla. Mientras mayor sea la calificación, mejor será el desempeño. Las calificaciones de desempeño en el trabajo. Las calificaciones de desempeño fabricados por cada empleado por semana, promediados durante los últimos 6 meses. a. Construya una gráfica de dispersión del desempeño en el trabajo y la primera prueba, utilizando la prueba 1 como la variable X. ¿Parece lineal la relación? b. Suponga que la relación anterior es lineal y calcule el valor de la r de Pearson. c. Construya una gráfica de dispersión del desempeño en el trabajo y la segunda prueba, utilizando la prueba 2 como la variable X. ¿Parece lineal la relación? d. Suponga que la relación anterior es lineal, calcule el valor de la r de Pearson.
  • 66. e. Si sólo pudiera utilizar una de las pruebas para la selección de los empleados, ¿utilizaría alguna de ellas? En tal caso, ¿cuál de ellas? Explique. EMPLEADO 1 2 3 4 5 6 7 8 9 10 Desempeño en el trabajo 50 74 62 90 98 52 68 80 88 76 Examen 1 10 19 20 20 21 14 10 24 16 14 Examen 2 25 35 40 49 50 29 32 44 46 35 120 100 80 60 Series1 40 20 0 0 10 20 30
  • 67. 0,5917 120 100 80 60 Series1 40 20 0 0 20 40 60
  • 69. ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL EVALUACIÓN SEXTO A NOCHE CÁLCULO DEL COEFICIENTE r DE PEARSON Y REALICE LA GRÁFICA ESTUDIANTE PROPORCIÓN DE ATRACCIÓN Y NÚMERO ACTITUDES SIMILARES X 1 0.30 8.9 2 0.44 9.3 3 0.67 9.6 4 0.00 6.2 5 0.50 8.8 6 0.15 8.1 7 0.58 9.5 8 0.32 7.1 9 0.72 11.0 10 1.00 11.7 11 0.87 11.5 12 0.09 7.3 13 0.82 10.0 14 0.64 10.0 15 0.24 7.5
  • 70. EJERCICIO RESUELTO Nº2 DE CÁLCULO DEL COEFICIENTE DE CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS DETERMINANCDO EL CUADRO AUXILIAR Y REALICE LA GRÁFICA PRUEBA DE EXAMEN DE HABILIDAD MENTAL ADMISIÓN X Y Susana 5 15 Iván 10 20 Lourdes 15 25 Aldo 20 30 Juan 25 35 María 30 40 César 35 45 Olga 40 50
  • 71. ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL EVALUACIÓN SEXTO A NOCHE EJERCICIO RESUELTO Nº2 DE CÁLCULO DEL COEFICIENTE DE CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS DETERMINANDO EL CUADRO AUXILIAR Y REALICE LA GRÁFICA ITALIANOS ESTADOUNIDENSES 100 80 73 95 65 85 63 52 53 72 50 50 47 40 45 30 40 28 39 42 39 36 29 41 23 35 13 16 12 10
  • 72. c. Suponga que los datos tienen al menos una escala de intervalo y calcule la correlación entre los datos estadounidenses y la de los italianos. d. Suponga que los datos sólo tienen una escala ordinal y calcule la correlación entre los datos de ambas culturas. BIBLIOGRAFÍA Legoas, L. A. (2008). Estadística Básica. En L. A. Legoas, Estadística Básica (págs. 177-211). Lima: San Marcos. Mendano, J. (2007). Estadística General. En J. Mendano, Estadística General. México: Majangrail. Zamora, M. C. (2006). Estadística Inferencial. En M. C. Zamora, Estadística Inferencial. Lima: Moshera.
  • 73. Universidad Politécnica Estatal del Carchi Comercio Internacional, Integración, Administración y Economía Empresarial. Escuela: Comercio Exterior y Negociación Comercial Internacional PORTAFOLIO DEL ALUMNO MARICELA AYALA ESTADISTICA INFERENCIAL II ING. JORGE POZO Nivel: sexto Paralelo: “a” Noche AÑO-LECTIVO 2012
  • 74. CORRELACIÓN En capítulos anteriores se estudiaron las distribuciones de una frecuencia, ordenaremos el estudio de 2 variables y qué sentido tiene afirmar que 2 variables están relacionadas linealmente entre sí. En la correlación hasta ahora se a abordado en forma general problemas relacionados únicamente con una solo variable es decir univariados sin embargo existen muchas situaciones en las cuales se trabaja con pares de variables, y donde se busca contestar la pregunta de si existe o no una asociación entre ambas mediciones o variables. (Cortes, 2009) E l p ro b lem a ce rcan o de la co rre la ció n o gra d o d e in te rco n e xió n e n t re va ria b le s qu e in t e n ta n d e te rm in a r con qu e p re cisió n d e scrib e o e xp lica la re la ció n e n t re va ria b le s, u na e cu ació n lin e a l o d e cu a lqu ie r o tro t ip o , si t od o s lo s va lo re s d e la s va ria b le s e st á n pe rf e ct am en t e co rre la cio na do s o qu e ha y co rre la ción p e rf e cta en t re e llas. (S p ie ge l, 19 9 1 ) COEFICIENTE DE CORRELACIÓN.- Expresa de una manera cuantitativa la magnitud y dirección de una relación. Coeficiente de correlación se lo designa en la letra r puede variar entre +1 a -1 el signo nos dice si la relación es positiva o negativa. Como +1 es el mayor número posible este representa una relación perfecta de una relación positiva. Si el coeficiente es -1 que la relación se perfecta que la relación es negativa. Cuando la correlación es cero (0) no existe una relación entre x y significa que x y no crece ni decrece la recta es horizontal.
  • 75. COEFICIENTE DE CORRELACIÓN El coeficiente de correlación de la r de Person toma valores comprendidos entre -1 y +1 pasando por (o) el numero -1 corresponde a una correlación negativa perfecta y la +1 a una correlación positiva perfecta el coeficiente de r es igual a O se obtiene cuando no existe ninguna correlación negativa y os valores positivos menores que uno indica una correlación positiva. COEFICIENTE DE CORRELACIÓN El coeficiente entre la variación explicada y la variación total se llaman coeficiente de determinación. Si la variación explicada es cero o sea toda la variación es variación inexplicada, ese coeficiente es cero. Si la variación inexplicada es cero o sea toda la variación es explicada, el coeficiente es uno. (Spiegel, 1991) COEFICIENTE DE CORRELACIÓN El valor del coeficiente de correlación también llamado de Person ayuda a contestar la pregunta ¿existe correlación lineal entre las dos variables? El coeficiente de correlación de r siempre tiene un valor de -1 y +1 indica una correlación positiva o negativa. (Cortes, 2009)
  • 76. RELACIÓN PERFECTA.- Es aquella que existe una relación positiva o negativa para lo cual todos los puntos caen sobre la recta. RELACIÓN IMPERFECTA.- Es aquella que existe una relación pero no todos los puntos caen sobre una recta. Un plano cartesiano con una mejor exactitud mediante una línea recta por la ecuación. Y= bx + a b=pendiente o m= a= Ordenada EJEMPLO DE UNA RELACIÓN NEGATIVA Es una relación negativa perfecta, ya que los valores mayores se asocian con los otros valores menores de la relación. Y 15 ∆X (8, 13) ∆Y (20,10) 10 5 X 5 10 15 20 25
  • 77. COEFICIENTE DE CORRELACIÓN DE PEARSON Todo coeficiente de correlación que no sea cero indica cierto grado de relación entre 2 variables, lo que el grado de intensidad es fuerte o débil de una interpretación matemática pura, el hecho de que 2 variables tienden a aumentar o disminución sobre una de ellas. La r de Pearson es una medida del grado en el cual las parejas de datos ocupan posiciones iguales u opuestas dentro sus propias distribuciones. (PAGANO, Robert. Estadística para las ciencias del comportamiento. En estadística inferencial. 7a.ed. Mexico. DF: 2006.pp 113 ISBN: 0534617670) En estadística, el coeficiente de correlación de Pearson es un índice que mide la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas. (Cortes, 2009) MATEMARICAMENTE Entre 2 variables se lo interpreta como: INTERPRETACIÓN.- Que tan elevado es el coeficiente de correlación dado todo r=0 indica cierto grado de relación entre 2 variables, que grado de Intensidad de relación se puede considerar, si la relación es fuerte o débil.
  • 78. COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPERMAN El coeficiente de correlación mide el grado de asociación entre dos cantidades, pero no mira el nivel de acuerdo o concordancia. Esta prueba estadística permite medir la correlación o asociación de dos variables y es aplicable cuando las mediciones se realizan en una escala ordinal, aprovechando la clasificación por rangos. (Spiegel, 1991) Se utiliza cuando una o ambas variables corresponden solo a una escala ordinal Sperman es en realidad el coeficiente de correlación lineal r de Pearson aplicado a los datos que satisfacen los requisitos de una escala ordinal. (PAGANO, Robert. Estadística para las ciencias del comportamiento. En estadística inferencial. 7a.ed. Mexico. DF: 2006.pp 121ISBN: 0534617670) Cuando una o más variables son solo de escala ordinal. FORMULA MATEMÁTICA: rs = 1- Di= R(xi) – R(yi) EJERCICIO EN CLASE Nº 1 Dados los siguientes conjuntos de parejas de datos muéstrales:
  • 79. 1 1 4 2 1 5 4 2 5 4 4 4 7 3 8 5 7 3 10 4 9 1 10 2 13 5 10 4 13 1 a) Utilice la ecuación para el valor de la r de Pearson para cada conjunto. Observe que en el conjunto B, donde la correlación es menor, algunos de los valores; Zx Zy son positivos y otros son negativos. Éstos tienden a cancelarse entre sí, lo cual hace que r tenga una menor magnitud. Sin embargo, en los conjuntos A Y C, todos los productos tienen el mismo signo, haciendo que la magnitud de r aumente. Cuando las parejas de datos ocupan las mismas u opuestas posiciones dentro de sus propias distribuciones, los productos Zx Zy tienen el mismo signo, lo cual produce una mayor magnitud de r. Para A calculamos los valores de , y las sumatorias respectivas. b) Calcule r para el conjunto B, utilizando la ecuación para los datos en bruto. ¿Qué prefiere, utilizar la ecuación de los datos en bruto o la de los puntajes z? C) Sume la constante 5 a los datos X en el conjunto A y calcule r de nuevo, mediante la ecuación de los datos en bruto. ¿Ha cambiado el valor?
  • 80. d) Multiplique los datos X del conjunto A por 5 y calcule r de nuevo. ¿ ha cambiado algún valor? e) generalice los resultados obtenidos en las partes c y d, restando y dividiendo los datos entre una constante. ¿Qué le dice esto sobre r ?
  • 81.
  • 82.
  • 83. 2.- En un largo curso de introducción a la sociología, un profesor hace dos exámenes. El profesor quiere determinar si las calificaciones de los estudiantes en el segundo examen están correlacionadas con las calificaciones del primero. Para facilitar, se elige una muestra de ocho estudiantes con las calificaciones que aparecen en la siguiente tabla. a) Construya una grafica de dispersión para los datos, utilizando la calificación del primer examen como la variable X. ¿Parece lineal la ecuación? b) Suponga que existe una relación lineal en las calificaciones de los dos exámenes. Calcule el valor de la r de Pearson. c) ¿Qué tan bien explican, las calificaciones del segundo examen.?
  • 84. Ejercicio 14: ejercicio 14 ESTUDIANTE EXAMEN1 EXAMEN 2 1 60 60 2 75 100 3 70 80 4 72 68 5 54 73 6 83 97 7 80 85 8 65 90 ESTUDIANTE EXAMEN1 EXAMEN 2 X2 Y2 1 60 60 3600 3600 2 75 100 5625 10000 3 70 80 4900 6400 4 72 68 5184 4624 5 54 73 2916 5329 6 83 97 6889 9409 7 80 85 6400 7225 8 65 90 4225 8100 TOTAL 8 559 653 39739 54687 DATOS ∑XY 46239 7178,875 R= (∑X) 559 940835,891 (∑Y) 653 n 8 R= 0,00763032 ∑X2 39739 % 0,76303158 ∑Y2 54687
  • 85. Se puede analizar que de una perspectiva los estudiante han tenido un incremento del 73% para la realización del segundo examen es decir las políticas adoptadas por estudiante docente han funcionado. La tabla muestra un salario mensual que perciben 5 agentes de ventas el valor en dólares. AGENTE VARIABLE X MERCANCIA VENDIDA Y VARIABLE SALARIOS EN EN $ $ 1 0 500 2 1000 900 3 2000 1300 4 3000 1700 5 4000 2100 2500 2000 1500 1000 500 0 0 1000 2000 3000 4000 5000 m = m= a= 500 y= ax + b y=0.40x + 500
  • 86. La ecuación y=0.40x + 500 nos indica la relación entre el salario y la mercadería vendida esto nos indica que y se incrementa 0.4 por cada unitario de xi, con esta relación podemos producir cualquier valor de y si solo se conoce el valor de xi. EJEMPLO X=1500 Y`= 0,40 x + 500 Y´= 0,40(1500) + 500 Y´= 1100 Así una agente vende $1500 de mercancía y su salario casi igual a $1100
  • 87. EJERCICIO: ESTUDIANTE PRUEBA DE HABILIDAD EXAMEN DE ADMISIÓN MENTAL (X) (Y) María 18 82 Jessica 15 68 Carla 12 60 Nancy 9 32 Juan 3 18 GRÁFICA: 90 80 70 60 50 40 30 20 10 0 0 5 10 15 20
  • 88. EJEMPLO DEL COEFICIENTE DE SPERMAN ESTUDIANTE COEFICIENTE X´ PUNTAJE Y´ Di=x´-y´ INTELECTUAL X Y 1 0.30 11 8.9 9 2 4 2 0.44 9 9.3 8 1 1 3 0.67 5 9.6 6 -1 1 4 0 15 6.2 15 0 0 5 0.50 8 8.8 10 -2 4 6 0.15 13 8.1 11 2 4 7 0.58 7 9.5 7 0 0 8 0.32 10 7.1 14 -4 16 9 0.72 4 11 3 1 1 10 1 1 11.7 1 0 0 11 0.87 3 11.5 2 1 1 12 0.09 14 7.3 13 1 1 13 0.89 2 10 4.5 -2.5 6.25 14 0.64 6 10 4.5 1.5 2.25 15 0.24 12 7.5 12 0 0 41.50 r= 1 - r= 1 – r= 1 - r= 0.93
  • 89. EJEMPLOS DE EJERCICIOS: X Y x.y María 18 82 324 6724 1476 Olga 15 68 225 4624 1020 Susana 12 60 144 3600 720 Aldo 9 32 81 1024 288 Juan 3 18 9 324 54 57 260 783 16296 3558 r= r= r= r= r= 0.98
  • 90. EJERCICIO Nº2 GRÁFICA 12 10 8 6 4 2 0 0 2 4 6 8 10 12 ECUACION
  • 91. RESOLVER EL COEFICIENTE DE PEARSON X Y x.y 1 6 5 36 25 30 2 5 3 25 9 15 3 7 4 49 16 28 4 10 8 100 64 80 5 2.5 1 6.25 1 2.5 6 2.5 6 6.25 36 15 7 9 10 81 100 90 8 1 2 1 4 2 9 11 9 121 81 99 10 4 7 16 49 28 11 8 11 64 121 88 12 12 12 144 144 144 78 78 649.50 650 621.50 r= r=
  • 92. r= r= r= 0.80 COEFICIENTE DE SPERMAN X X´ Y Y´ Di=x´-y´ 1 6 7 5 8 -1 1 2 5 8 3 10 -2 4 3 7 6 4 9 -3 9 4 10 3 8 5 -2 4 5 2.5 10.5 1 12 -1.5 2.25 6 2.5 10.5 6 7 3.5 12.25 7 9 4 10 3 1 1 8 1 12 2 11 1 1 9 11 2 9 4 -2 -4 10 4 9 7 6 3 9 11 8 5 11 2 3 9 12 12 1 12 1 0 0 48.5
  • 93. r= 1 - r= 1 – r= 1 - r= 0.83 EJERCICIO Nº3 GRÁFICA 12 10 8 6 4 2 0 0 2 4 6 8 10 12 ECUACION
  • 94. RESOLVER EL COEFICIENTE DE PEARSON X Y x.y 1 0.30 8.9 0.09 79.21 2.67 2 0.44 9.3 0.19 86.49 4.09 3 0.67 9.6 0.45 92.16 6.43 4 0 6.2 0 38.44 0 5 0.50 8.8 0.25 77.44 4.4 6 0.15 8.1 0.02 65.61 1.22 7 0.58 9.5 0.34 90.25 5.51 8 0.32 7.1 0.10 50.41 2.27 9 0.72 11 0.52 121 7.92
  • 95. 10 1 11.7 1 136.89 11.7 11 0.87 11.5 0.76 132.25 10.01 12 0.09 7.3 0 53.29 0.66 13 0.89 10 0.79 100 8.9 14 0.64 10 0.41 100 6.4 15 0.24 7.5 0.06 56.25 1.8 7.41 136.50 4.98 1279.69 73.98 r= r= r= r= r= 0.93 COEFICIENTE DE SPERMAN ESTUDIANTE COEFICIENTE X´ PUNTAJE Y´ Di=x´-y´ INTELECTUAL X Y 1 0.30 11 8.9 9 2 4 2 0.44 9 9.3 8 1 1 3 0.67 5 9.6 6 -1 1
  • 96. 4 0 15 6.2 15 0 0 5 0.50 8 8.8 10 -2 4 6 0.15 13 8.1 11 2 4 7 0.58 7 9.5 7 0 0 8 0.32 10 7.1 14 -4 16 9 0.72 4 11 3 1 1 10 1 1 11.7 1 0 0 11 0.87 3 11.5 2 1 1 12 0.09 14 7.3 13 1 1 13 0.89 2 10 4.5 -2.5 6.25 14 0.64 6 10 4.5 1.5 2.25 15 0.24 12 7.5 12 0 0 41.50 r= 1 - r= 1 – r= 1 - r= 0.93
  • 98. RESOLVER EL COEFICIENTE DE PEARSON X Y x.y Maria 18 82 324 6724 1476 Olga 15 68 225 4624 1020 Susana 12 60 144 3600 720 Aldo 9 32 81 1024 288 Juan 3 18 9 324 54 57 260 783 16296 3558 r= r= r= r=
  • 99. r= 0.98 COEFICIENTE DE SPERMAN ESTUDIANTE COEFICIENTE X´ PUNTAJE Y´ Di=x´-y´ INTELECTUAL X Y Maria 18 1 82 1 0 0 Olga 15 2 68 2 0 0 Susana 12 3 60 3 0 0 Aldo 9 4 32 4 0 0 Juan 3 5 18 5 0 0 0 r= 1 - r= 1 – r= 1 - r= 1
  • 100. EJERCICIO Nº5 GRÁFICA EJERCICIO N º 5 90 80 70 60 50 40 30 20 10 0 0 5 10 15 20 ECUACION
  • 101. RESOLVER EL COEFICIENTE DE PEARSON X Y x.y 1 18 18 324 324 324 2 15 22 225 6724 1230 3 12 68 144 4624 816 4 9 60 81 3600 540 5 3 32 9 1024 96 57 260 783 16296 3006 r= r= r= r= r= 0.07
  • 102. COEFICIENTE DE SPERMAN X X´ Y Y´ Di=x´-y´ 1 18 1 18 5 -4 16 2 15 2 82 1 1 1 3 12 3 68 2 1 1 4 9 4 60 3 1 1 5 3 5 32 4 1 1 20 r= 1 - r= 1 – r= 1 - r= 0
  • 103. EJERCICIO Nº6 GRÁFICO EJERCICIO Nº 6 80 70 60 50 40 30 20 10 0 0 5 10 15 20
  • 104. RESOLVER EL COEFICIENTE DE PEARSON X Y x.y 1 18 18 324 324 324 2 15 32 225 1024 480 3 12 60 144 3600 720 4 9 68 81 4624 612 5 3 82 9 6724 246 57 260 783 16296 2382 r= r= r= r= r= -0.96
  • 105. EL COEFICIENTE DE PEARSON: X Y x.y J 49 48 2401 2304 2352 K 47 45 2209 2025 2115 L 42 22 1764 484 924 P 39 22 1521 484 854 F 37 40 1369 1600 1480 Z 32 40 1024 1600 1280 6 246 217 10288 8497 9009 r= r= r=
  • 106. r= r= 0.31 COEFICIENTE DE SPERMAN X X´ Y Y´ Di=x´-y´ J 49 1 48 1 0 0 K 47 2 45 2 0 0 L 42 3 22 5.5 -2.5 6.25 P 39 4 22 5.5 -1.5 2.25 F 37 5 40 3.5 1.5 2.25 Z 32 6 40 3.5 2.5 6.25 17 r= 1 - r= 1 – r= 1 - r= 0.51
  • 108. EJERCICIOS PROPUESTOS Resolver los siguientes ejercicios: X Y 10 7 8 4 9 5 11 4 11 8 14 6 10 9 9 8 11 7 13 5 15 4 16 6 X Y 86 15 74 43 73 16 65 11 82 10 78 13 79 14 70 15 50 10 65 9
  • 109. COEFICIENTE DE CORRELACION Expresa de una manera cuantitativa la magnitud y dirección de una relación, se lo designa en la letra r puede variar entre +1 a -1 el signo nos dice si la relación es positiva o negativa. Relación perfecta Relación Imperfecta Relación Lineal Es aquella que existe una Es aquella que existe una Existe 2 variables es relación positiva o negativa relación positiva o negativa aquella que puede para lo cual todos los puntos para lo cual todos los representarse en un plano cartesiano con caen sobre la recta. puntos caen sobre la recta. una mejor exactitud mediante una línea recta por la ecuación. FORMULAS PEARSON r= SPERMAN rs= 1-
  • 110. APRENDIZAJE MEDIADO NIVEL TEÓRICO PRÁCTICO  Lectura comprensiva de los conceptos básicos de la correlación.  Analizar los conceptos de la correlación. NIVEL TEÓRICO AVANZADO  Elaborar un organizador grafico de la teoría de la correlación.  Realizar nuestros propios conceptos para mayor entendimiento. NIVEL TEÓRICO BÁSICO PRÁCTICO  Resolver ejercicios sobre pruebas de psicológicas realizada a estudiantes aplicando los coeficientes de correlación.  Establecer problemas y resolverlos aplicando los coeficientes de correlación. NIVEL TEÓRICO BÁSICO PRÁCTICO AVANZADO  Con datos de importaciones de productos aplicar los coeficientes de correlación.  Resolver ejercicios con datos de exportaciones con la aplicación de los coeficientes de correlación.
  • 111. APRENDIZAJE AUTÓNOMO NIVEL TEÓRICO PRÁCTICO  Investigar otros conceptos de la correlación en libros e internet.  Hacer un resumen de la investigación realizada. NIVEL TEÓRICO AVANZADO  Elaboración de un Mentefacto de la correlación.  Elaboración de ejemplos pequeños para una mayor comprensión de los conceptos de la correlación. NIVEL TEÓRICO BÁSICO PRÁCTICO  Realizar ejercicios sobre pruebas que se tomaron a estudiantes, coeficiente intelectual, psicológicas aplicando los coeficientes de correlación.  Resolver un problema de una investigación realizada sobre el nivel de herotina de los monos aplicando los coeficientes de correlación. NIVEL TEÓRICO BÁSICO PRÁCTICO AVANZADO  Investigar los datos de importaciones o exportaciones de la página del Banco Central del Ecuador en los años 2011- 2012 aplicar los coeficientes de correlación.  Con los datos de las exportaciones o importaciones de datos reales de la página del Banco Central recolectando datos del primer trimestre del año 2011 -2012 aplicar los coeficientes de correlación.
  • 112. REGRESIÓN LINEAL La regresión y la correlación están íntimamente ligados, ambos implican la relación entre 2 variables y utilizan el mismo conjunto de datos básicos. La regresión se centra en el uso de la relación para determinar una predicción, cuando la relación es perfecta, esto es cuando todos los puntos están sobre la recta y se utilizan para señalar la predicción, la situación se hace más compleja cuando la relación es imperfecta. Esta recta es la línea de regresión por los mínimos cuadrados. La distancia vertical en cada punto y la recta representan el error de la predicción, pareciera que el error total seria la suma algebraica . El error total de predicción presentado por , es menor para la línea de regresión por mínimos cuadrados. En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio (Cortes, 2009). La palabra regresión se emplea para denotar el proceso de estimar el valor de una de las variables en función de otra, cuyo valor se considerado. (MARTINEZ, 2001) La ecuación por los mínimos cuadrados está dado por , ecuación de regresión lineal para predicción y dado por X. = Valor predicho by = Pendiente ay = Ordenado al origen
  • 113. FORMULA DE LA REGRESIÓN ECUACIÓN PARA CALCULAR LA CONSTANTE DE REGRESIÓN EJERCICIO Nº 1 El aprovechamiento de los estudiantes con relación al promedio de calificaciones para cada uno. ESTUDIANTES APROVECHAMIENTO PROMEDIO XY (X) (Y) 1 110 1 110 12100 2 112 1.6 179.20 12544 3 118 1.2 141.60 13924 4 119 2.1 249.90 14161 5 122 2.6 317.20 14884 6 125 1.8 225 15625 7 127 2.6 330.20 16129 8 130 2 260 16900 9 132 3.2 422.40 17424 10 134 2.6 384.40 17956 11 136 3 408 18496 12 138 3.6 496.80 19044 1503 27.30 3488.70 189187
  • 114.
  • 115. Ejemplo de la grafica de acuerdo con los resultados propuesta de los ejercicios donde podemos observar una grafica positiva y unos puntos dispersos. Esta es un gráfica con una relación imperfecta positiva (m +).
  • 116. DETERMINAR EL COEFICIENTE DE PEARSON Y SPERMAN COEFICIENTE DE PEARSON COEFICIENTE DE SPERMAN
  • 117. LA ECUACIÓN LINEAL A TRAVÉS DEL MÉTODO ESTADÍSTICO Y LA REGRESIÓN LINEAL REGRESIÓN CONSISTENTE DE REGRESIÓN ECUACIÓN MÁTEMATICA
  • 118. EJERCICIO PROPUESTO Resolver los siguientes ejercicios: X Y X Y 63 56 159.2 167.15 60 60 206.3 95 57 61 188.07 197.5 58 60 196.7 215.3 79 65 143.9 145.7 55 62 324.5 154.9 57 58 248.3 153.5 58 61 199.2 156.6 65 56 110.2 178.2 73 65 169.7 210.9 66 69 174.5 215.3 63 59 70 66 65 60 61 67
  • 119. REGRESIÓN LINEAL Es una relación entre 2 variables y utiliza un conjunto de datos básicos. La regresión se centra en el uso de la relación para determinar una predicción. FÓRMULA = Valor predicho by = Pendiente APRENDIZAJE MEDIDO ay = Ordenado al origen