SlideShare uma empresa Scribd logo
1 de 38
Análisis de
Regresión y Correlación
Introducción
Muchas veces las decisiones se basan en la relación entre
 dos o más variables.Ejemplos

• Dosis de fertilizantes aplicadas y rendimiento del cultivo.

• La relación entre la radiación que reciben los sensores con
  la que se predicen los rendimientos por parcelas con los
  rendimientos reales observados en dichas parcelas.

• Relación entre tamaño de un lote de producción y horas –
  hombres utilizadas para realizarlo.


  Distinguiremos entre relaciones funcionales y relaciones
                         estadísticas
Relación funcional entre dos
              variables
  Una relación funcional se expresa mediante
una función matemática.
Si X es la variable independiente e Y es la variable
dependiente, una relación funcional tiene la forma:
                        Y=f(X)
Ejemplo 1
         Parcela        Dosis      Rend.(kg/h)
            1             75           150
            2             25            50
            3            130           260
Figura 1
                        Relación funcional perfecta entre dosis y
                                      rendimientos
              300




              250
Rendimiento




              200




              150
                                                                Rend.
              100




              50




                0
                    0     20     40     60           80   100       120   140



                                             Dosis

Nota: Las observaciones caen exactamente sobre la línea de
relación funcional
Relación estadística entre dos
              variables
• A diferencia de la relación funcional, no es una
relación perfecta, las observaciones no caen
exactamente sobre la curva de relación entre las
variables
Ejemplo 2
   Lote de prod.   Tamaño del lote   Horas hombre
         1              30                73
         2              20                50
         3              60                128
         4              80                170
         5              40                87
Figura 2
                               Relación estadística entre tamaño del lote y
                                              horas hombre
                    1 80


                    1 60
     Horas hombre




                    1 40


                    1 20


                    1 00


                     80




                                                                        Horas hombre
                     60


                     40


                     20


                      0
                           0      10   20   30       40    50      60      70     80   90




                                                 Tamaño del lote

Nota: La mayor parte de los punto no caen directamente sobre
la línea de relación estadística.
Esta dispersión de punto alrededor de la línea representa la
variación aleatoria
Figura 3
               Coordenadas de puntos de control utilizados
                 para corregir la columna de los niveles
                    digitales de una imagen satelital
    7000



    6000



    5000



    4000



    3000



    2000



    1000



       0
           0    2      4      6      8     10     12    14   16




Nota: se trata de un terreno rugoso donde varían notablemente
las condiciones de observación del sensor, para corregir errores
geométricos de la imagen, se aplican funciones de segundo
grado. Los datos sugieren que la relación estadística es de tipo
curvilínea.
Conceptos básicos
• Análisis de Regresión: Es un procedimiento estadístico que estudia
  la relación funcional entre variables.Con el objeto de predecir una
  en función de la/s otra/s.
• Análisis de Correlación: Un grupo de técnicas estadísticas usadas
  para medir la intensidad de la relación entre dos variables
• Diagrama de Dispersión: Es un gráfico que muestra la intensidad y el
  sentido de la relación entre dos variables de interés.
• Variable dependiente (respuesta, predicha, endógena): es la
  variable que se desea predecir o estimar
• Variables independientes (predictoras, explicativas exógenas). Son
  las variables que proveen las bases para estimar.
• Regresión simple: interviene una sola variable independiente
• Regresión múltiple: intervienen dos o más variables independientes.
• Regresión lineal: la función es una combinación lineal de los
  parámetros.
• Regresión no lineal: la función que relaciona los parámetros no es
  una combinación lineal
Gráfico de dispersión
Los diagramas de dispersión no sólo muestran la
relación existente entre variables, sino también resaltan
las observaciones individuales que se desvían de la
relación general. Estas observaciones son conocidas
como outliers o valores inusitados, que son puntos de los
datos que aparecen separados del resto.
Coeficiente de correlación
            lineal
• El Coeficiente de Correlación (r)
 requiere variables medidas en escala de
 intervalos o de proporciones
  –   Varía entre -1 y 1.
  –   Valores de -1 ó 1 indican correlación perfecta.
  –   Valor igual a 0 indica ausencia de correlación.
  –   Valores negativos indican una relación lineal
      inversa y valores positivos indican una relación
      lineal directa
Correlación Negativa Perfecta
    10
     9
     8
     7
     6
Y    5
     4
     3
     2
     1
     0

         0   1   2   3   4   5   6   7   8   9   10
                             X
Correlación Positiva Perfecta
    10
     9
     8
     7
     6
Y    5
     4
     3
     2
     1
     0

          0   1   2   3   4   5   6   7   8   9   10
                              X
Ausencia de Correlación
    10
     9
     8
     7
     6
Y    5
     4
     3
     2
     1
     0

         0    1   2   3   4   5   6   7   8   9   10
                              X
Correlación Fuerte y Positiva
  10
   9
   8
   7
   6
Y 5
   4
   3
   2
   1
   0

        0   1   2   3   4   5   6   7   8   9   10
                            X
Fórmula para el coeficente de
      correlación (r) Pearson


         n(ΣXY) (ΣX)(ΣY)
r=
   [ n(ΣX ) (ΣX) ] [ n( ΣY ) ( ΣY)
           2       2      2          2
                                         ]
Modelos de Regresión

Un modelo de regresión, es una manera de
expresar dos ingredientes esenciales de
una relación estadística:
  Una tendencia de la variable dependiente Y a
  variar conjuntamente con la variación de la o
  las X de una manera sistemática
  Una dispersión de las observaciones alrededor
  de la curva de relación estadística
Modelos de Regresión

Estas dos características están implícitas en un
modelo de regresión, postulando que:
   En la población de observaciones asociadas con el
   proceso que fue muestreado, hay una distribución
   de probabilidades de Y para cada nivel de X.
   Las medias de estas distribuciones varían de manera
   sistemática al variar X.
Representación gráfica del
         modelo de Regresión Lineal




Nota: en esta figura se muestran las distribuciones de probabilidades
de Y para distintos valores de X
Análisis de Regresión

• Objetivo: determinar la ecuación de regresión para
  predecir los valores de la variable dependiente (Y)
  en base a la o las variables independientes (X).
• Procedimiento: seleccionar una muestra a partir de
  la población, listar pares de datos para cada
  observación; dibujar un diagrama de puntos para
  dar una imagen visual de la relación; determinar la
  ecuación de regresión.
Supuestos de Regresión Lineal
            Clásica
• Cada error está normalmente distribuido
  con:
  – Esperanza de los errores igual a 0
  – Variancia de los errores igual a una
    constante σ 2.
  – Covariancia de los errores nulas para todo
    i≠j
Proceso de estimación de la regresión lineal simple
     Modelo de regresión          Datos de la muestra
       y=β0+β1x+ε                      x            y
                                       x1           y1
   Ecuación de regresión               x2           y2
      E(y)=β0+β1x                      .            .
   Parámetros desconocidos             .            .
           β0.β1                       .            .
                                       xn           yn




                                  Ecuación estimada de
           b0 y b1                     regresión
                                       y=b0+b1x
   proporcionan estimados       Estadísticos de la muestra
          β0 y β1                           b0.b1
Líneas posibles de regresión en la
            regresión lineal simple
            Sección A                      Sección B                       Sección C
    Relación lineal positiva       Relación lineal negativa             No hay relación

      Ey                               Ey                              Ey
                                            La pendiente β 1
      Línea de regresión           *        es negativa                 La pendiente β 1
                                                                        es 0
*          La pendiente β 1                                        *
           es positiva                  Línea de regresión             Línea de regresión



                               x                               x                            x

      * Ordenada al origen β 0
Estimación de la ecuación de
        Regresión Simple
• Y’= a + bX, donde:
   –   Y’ es el valor estimado de Y para distintos X.
   –   a es la intersección o el valor estimado de Y cuando X=0
   –   b es la pendiente de la línea, o el cambio promedio de Y’
       para cada cambio en una unidad de X
   –   el principio de mínimos cuadrados es usado para obtener a
       y b:

                  n( Σ ) − Σ )( Σ )
                      XY     ( X    Y
               b=
                    n( Σ 2 ) − Σ ) 2
                        X      ( X
                   ΣY     ΣX
               a =    − b
                   n      n
Mínimos cuadrados - Supuestos
•   El modelo de regresión es lineal en los parámetros.
•   Los valores de X son fijos en muestreo repetido.
•   El valor medio de la perturbación εi es igual a cero.
•   Homocedasticidad o igual variancia de εi.
•   No autocorrelación entre las perturbaciones.
•   La covariancia entre εi y Xi es cero.
•   El número de observaciones n debe ser mayor que
    el número de parámetros a estimar.
•   Variabilidad en los valores de X.
•   El modelo de regresión está correctamente
    especificado.
•   No hay relaciones lineales perfectas entre las
    explicativas.
Estimación de la variancia de los
      términos del error (σ2)
Debe ser estimada por varios motivos
• Para tener una indicación de la variabilidad
  de las distribuciones de probabilidad de Y.
• Para realizar inferencias con respecto a la
  función de regresión y la predicción de Y.
• La lógica del desarrollo de un estimador de
  σ 2 para el modelo de regresión es la misma
  que cuando se muestrea una sola población
• La variancia de cada observación Yi es σ 2, la
  misma que la de cada término del error
Estimación de la variancia de los
     términos del error (σ2)
Dado que los Yi provienen de diferentes distribuciones
de probabilidades con medias diferentes que
dependen del nivel de X, la desviación de una
observación Yi debe ser calculada con respecto a su
propia media estimada Yi.
Por tanto, las desviaciones son los residuales
                             ˆ
                        Yi - Yi = e i
 Y la suma de cuadrados es:
          n                   n                       n

   e
            ˆ
SC = ∑ (Y − Y ) = ∑ (Y − a − bX ) = ∑ e
                i   i
                        2
                                    i       1
                                                 2          2
                                                            i
         i =1                i =1                    i =1
Estimación de la variancia de los
     términos del error (σ2)
La suma de cuadrados del error, tiene n-2 grados de
libertad asociados con ella, ya que se tuvieron que
estimar dos parámetros.
Por lo tanto, las desviaciones al cuadrado dividido por
los grados de libertad, se denomina cuadrados medios
                                  n     2


                  SC   ∑e
             CM =    =     e     i =1   i

                  n−2 n−2
                 e




Donde CM es el Cuadrado medio del error o cuadrado
medio residual. Es un estimador insesgado de σ 2
Análisis de Variancia en el análisis
           de regresión
• El enfoque desde el análisis de variancia se basa en
  la partición de sumas de cuadrados y grados de
  libertad asociados con la variable respuesta Y.
• La variación de los Yi se mide convencionalmente
  en términos de las desviaciones
                      (Y − Y )
                         i       i

• La medida de la variación total Sctot, es la suma de
  las desviaciones al cuadrado
                     ∑ (Y − Y )
                                         2
                             i       i
Desarrollo formal de la partición
Consideremos la desviación
                       (Y − Y )
                         i       i
Podemos descomponerla en

           (Y i
                  − Y ) = (Y − Y) + (Y − Y )
                           ˆ i       i
                                         ˆi

                 T           R         E
(T): desviación total
(R): es la desviación del valor ajustado por la
  regresión con respecto a la media general
(E): es la desviación de la observación con respecto
      a la línea de regresión
Desarrollo formal de la partición
Si consideremos todas las observaciones y elevamos al
cuadrado para que los desvíos no se anulen

      ∑ ( Y − Y ) = ∑ (Y − Y) + ∑ (Y − Y )
                                2                2

           i
                 2
                       ˆ  i
                                       ˆi    i


            SCtot        SCreg          SCer
(SCtot): Suma de cuadrados total
(SCreg): Suma de cuadrados de la regresión
(SCer): Suma de cuadrados del error
Dividiendo por los grados de libertad, (n-1), (k) y
(n-2), respectivamente cada suma de cuadrados, se
obtienen los cuadrados medios del análisis de
variancia.
Coeficiente de Determinación

• Coeficiente de Determinación, R2 - es la
  proporción de la variación total en la
  variable dependiente Y que es explicada o
  contabilizada por la variación en la variable
  independiente X.
   – El coeficiente de determinación es el
     cuadrado del coeficiente de correlación, y
     varia entre 0 y 1.
Cálculo del R2 a través de la
     siguiente fórmula



        ∑ (ˆ − y)
           y           2

    R =
      2         c


        ∑ (y − y)
                       2
                o
Inferencia en Regresión
• Los supuestos que establecimos sobre los
  errores nos permiten hacer inferencia sobre
  los parámetros de regresión (prueba de
  hipòtesis e intervalos de confianza), ya que
  los estimadores de β0 y β1 pueden cambiar su
  valor si cambia la muestra.
• Por lo tanto debemos conocer la distribución
  de los estimadores para poder realizar
  prueba de hipòtesis e intervalos de confianza
Ejemplo
Se desean comparar los rendimientos predichos a partir de la
información obtenida por 3 sensores sobre los rendimientos
reales por parcelas de lotes de maíz. Los rendimientos (Y) y el
los rindes predichos de 4 sensores se presentan a continuación
            Sensor 1   Sensor 4   Sensor 5   Rendimiento
             0,0754     0,3083     0,1212      42,5846
             0,0754     0,3083     0,1212      43,8576
             0,0742     0,3327     0,1328      44,0082
             0,0766     0,3327     0,1251      43,4989
             0,0766     0,3297     0,1251      41,3327
             0,0730     0,3205     0,1193      41,0313
             0,0754     0,3114     0,1193      40,4802
             0,0766     0,2901     0,1193      36,6735
             0,0754     0,3449     0,1328      43,3535
             0,0754     0,3480     0,1193      43,3180
             0,0766     0,3480     0,1193      43,3143
             0,0766     0,3419     0,1135      41,0042
             0,0766     0,2840     0,1135      36,4908
             0,0766     0,3053     0,1193      37,5931
             0,0754     0,3266     0,1232      40,4556
             0,0766     0,2840     0,1135      35,5595
             0,0754     0,3358     0,1232      41,6400
             0,0742     0,3419     0,1251      43,5951

¿Qué sensor refleja mejor el rendimiento de esa zona?
Descripción Gráfica y cuantitativa de la relación entre
cada sensor y el rendimiento
                                                       Título


                PRED_Rendimiento
                                   45,95


                                   38,41


                                   30,87


                                   23,33


                                   15,79
                                       0,078   0,092   0,107    0,121    0,135
                                                        B5

                                                 Rendimiento
                                                 PRED_Rendimiento



Y = 338.71*X - 4.87
                                                             R2 = 0.32
PRED_Rendimiento
                                             Título

                           45,95


                           38,41


                           30,87


                           23,33


                           15,79
                               0,22   0,26    0,30    0,34   0,37
                                              B4

                                        Rendimiento
                                        PRED_Rendimiento




Y = 155.37*X – 13.25
                                                      R2 = 0.57
PRED_Rendimiento                       Título

                           45,95


                           38,41


                           30,87


                           23,33


                           15,79
                               0,071   0,076   0,081    0,087   0,092
                                                B1

                                         Rendimiento
                                         PRED_Rendimiento




Y = -1004.34*X +112.24
                                                         R2 = 0.44
Fuente
• file:///C:/Documents%20and
  %20Settings/Bachi44/Configuraci%F3n
  %20local/Archivos%20temporales%20de
  %20Internet/Content.IE5/CPE94BCP/256,1
  ,Diapositiva 1

Mais conteúdo relacionado

Mais procurados

Distribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplosDistribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplos
amy Lopez
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
thomas669
 
Análisis de regresión lineal y correlación lineal
Análisis de regresión lineal y correlación linealAnálisis de regresión lineal y correlación lineal
Análisis de regresión lineal y correlación lineal
Pedro Rico Hernández
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
thomas669
 
Distribuciones de variables aleatorias discretas y continuas
Distribuciones de variables aleatorias discretas y continuasDistribuciones de variables aleatorias discretas y continuas
Distribuciones de variables aleatorias discretas y continuas
Cristhiam Montalvan Coronel
 

Mais procurados (20)

estimacion
estimacionestimacion
estimacion
 
DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFB
DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFBDIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFB
DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFB
 
28 ejercicios
28 ejercicios28 ejercicios
28 ejercicios
 
Distribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplosDistribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplos
 
Distribución de poisson
Distribución de poissonDistribución de poisson
Distribución de poisson
 
5. regresión lineal multiple
5.  regresión lineal multiple5.  regresión lineal multiple
5. regresión lineal multiple
 
Tarea 16 de probabilidad y estadistica con respuestas
Tarea 16 de probabilidad y estadistica  con respuestasTarea 16 de probabilidad y estadistica  con respuestas
Tarea 16 de probabilidad y estadistica con respuestas
 
Teorema del limite central
Teorema del limite centralTeorema del limite central
Teorema del limite central
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
 
Análisis de regresión lineal y correlación lineal
Análisis de regresión lineal y correlación linealAnálisis de regresión lineal y correlación lineal
Análisis de regresión lineal y correlación lineal
 
Regresión y correlación estadística aplicada
Regresión y correlación estadística aplicadaRegresión y correlación estadística aplicada
Regresión y correlación estadística aplicada
 
Tarea 17 de probabilidad y estadistica con respuestas
Tarea 17 de probabilidad y estadistica con respuestasTarea 17 de probabilidad y estadistica con respuestas
Tarea 17 de probabilidad y estadistica con respuestas
 
Análisis de Regresión Lineal
Análisis de Regresión LinealAnálisis de Regresión Lineal
Análisis de Regresión Lineal
 
Tabla t Student
Tabla t StudentTabla t Student
Tabla t Student
 
correlacion (estadistica)
correlacion (estadistica) correlacion (estadistica)
correlacion (estadistica)
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
 
Tabla t student
Tabla t studentTabla t student
Tabla t student
 
Analisis de la varianza Est ind clase04
Analisis de la varianza Est ind clase04Analisis de la varianza Est ind clase04
Analisis de la varianza Est ind clase04
 
Regrecion lineal simple
Regrecion lineal simpleRegrecion lineal simple
Regrecion lineal simple
 
Distribuciones de variables aleatorias discretas y continuas
Distribuciones de variables aleatorias discretas y continuasDistribuciones de variables aleatorias discretas y continuas
Distribuciones de variables aleatorias discretas y continuas
 

Destaque

Tarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión linealTarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión lineal
María Gordón
 
Presentacion analisis de regresion
Presentacion analisis de regresionPresentacion analisis de regresion
Presentacion analisis de regresion
0KA
 
Análisis de regresión múltiple por pasos pablo palomo
Análisis de regresión múltiple por pasos pablo palomoAnálisis de regresión múltiple por pasos pablo palomo
Análisis de regresión múltiple por pasos pablo palomo
Pablo Palomo
 
Teoria De Correlacion
Teoria De CorrelacionTeoria De Correlacion
Teoria De Correlacion
mallita
 
Trabajo de metodologia de la investigacion
Trabajo de metodologia de la investigacionTrabajo de metodologia de la investigacion
Trabajo de metodologia de la investigacion
yeisonnarro
 

Destaque (20)

Análisis Estadístico
Análisis EstadísticoAnálisis Estadístico
Análisis Estadístico
 
Regresion Y Correlacion
Regresion Y CorrelacionRegresion Y Correlacion
Regresion Y Correlacion
 
Regresión por Mínimos Cuadrados
Regresión por Mínimos CuadradosRegresión por Mínimos Cuadrados
Regresión por Mínimos Cuadrados
 
Diagrama de dispersión
Diagrama de dispersiónDiagrama de dispersión
Diagrama de dispersión
 
Tarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión linealTarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión lineal
 
Estadística: Conceptos básicos
Estadística: Conceptos básicosEstadística: Conceptos básicos
Estadística: Conceptos básicos
 
Variables
VariablesVariables
Variables
 
Ecuación de regresión lineal
Ecuación de regresión linealEcuación de regresión lineal
Ecuación de regresión lineal
 
Hojas de control y diagrama de pareto
Hojas de control y diagrama de paretoHojas de control y diagrama de pareto
Hojas de control y diagrama de pareto
 
Teoría de regresión y correlación lineal
Teoría de regresión y correlación linealTeoría de regresión y correlación lineal
Teoría de regresión y correlación lineal
 
Coeficientes determinacion y correlacion
Coeficientes determinacion y correlacionCoeficientes determinacion y correlacion
Coeficientes determinacion y correlacion
 
Presentación diagramas de dispersion
Presentación diagramas de dispersionPresentación diagramas de dispersion
Presentación diagramas de dispersion
 
1. introducción (Metodología de la Investigación)
1. introducción (Metodología de la Investigación)1. introducción (Metodología de la Investigación)
1. introducción (Metodología de la Investigación)
 
Practica de laboratorio #1 proctor modificado
Practica de laboratorio #1 proctor modificadoPractica de laboratorio #1 proctor modificado
Practica de laboratorio #1 proctor modificado
 
Presentacion analisis de regresion
Presentacion analisis de regresionPresentacion analisis de regresion
Presentacion analisis de regresion
 
Análisis de regresión y correlación
Análisis de regresión y correlaciónAnálisis de regresión y correlación
Análisis de regresión y correlación
 
Análisis de regresión múltiple por pasos pablo palomo
Análisis de regresión múltiple por pasos pablo palomoAnálisis de regresión múltiple por pasos pablo palomo
Análisis de regresión múltiple por pasos pablo palomo
 
Teoria De Correlacion
Teoria De CorrelacionTeoria De Correlacion
Teoria De Correlacion
 
Trabajo de metodologia de la investigacion
Trabajo de metodologia de la investigacionTrabajo de metodologia de la investigacion
Trabajo de metodologia de la investigacion
 
Proyecto de correlacion
Proyecto de correlacionProyecto de correlacion
Proyecto de correlacion
 

Semelhante a Analisis De Regresion Y Correlacion

Estadistica para la investigación (sesión6)
Estadistica para la investigación (sesión6)Estadistica para la investigación (sesión6)
Estadistica para la investigación (sesión6)
Zarlenin docente
 
análisis de correlación y regresión lineales
análisis de correlación y regresión linealesanálisis de correlación y regresión lineales
análisis de correlación y regresión lineales
Tania Garcia
 
Estadistica para la investigación (sesión5) version mejorable
Estadistica para la investigación (sesión5) version mejorableEstadistica para la investigación (sesión5) version mejorable
Estadistica para la investigación (sesión5) version mejorable
Zarlenin docente
 
Regresión
RegresiónRegresión
Regresión
tmonicas
 

Semelhante a Analisis De Regresion Y Correlacion (20)

Estadistica para la investigación (sesión6)
Estadistica para la investigación (sesión6)Estadistica para la investigación (sesión6)
Estadistica para la investigación (sesión6)
 
análisis de correlación y regresión lineales
análisis de correlación y regresión linealesanálisis de correlación y regresión lineales
análisis de correlación y regresión lineales
 
Estadistica para la investigación (sesión5) version mejorable
Estadistica para la investigación (sesión5) version mejorableEstadistica para la investigación (sesión5) version mejorable
Estadistica para la investigación (sesión5) version mejorable
 
Clase regresion simple
Clase regresion simpleClase regresion simple
Clase regresion simple
 
Clase regresion simple
Clase regresion simpleClase regresion simple
Clase regresion simple
 
05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptx05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptx
 
Análisis de regresión
Análisis de regresiónAnálisis de regresión
Análisis de regresión
 
Clase03 entendiendo las relaciones
Clase03   entendiendo las relacionesClase03   entendiendo las relaciones
Clase03 entendiendo las relaciones
 
Regresion lineal simple
Regresion lineal simpleRegresion lineal simple
Regresion lineal simple
 
Regresion lineal simple
Regresion lineal simpleRegresion lineal simple
Regresion lineal simple
 
Clase 3 Correlación.ppt
Clase 3 Correlación.pptClase 3 Correlación.ppt
Clase 3 Correlación.ppt
 
Correlación
CorrelaciónCorrelación
Correlación
 
Regresión
RegresiónRegresión
Regresión
 
gráficas lineales
gráficas linealesgráficas lineales
gráficas lineales
 
Correlacion
CorrelacionCorrelacion
Correlacion
 
Correlacion lineal
Correlacion linealCorrelacion lineal
Correlacion lineal
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Análisis de Correlación y Regresión Lineal_2.pptx
Análisis de Correlación y Regresión Lineal_2.pptxAnálisis de Correlación y Regresión Lineal_2.pptx
Análisis de Correlación y Regresión Lineal_2.pptx
 
Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12ggggggggggggggggggggggggggMat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
 

Mais de JUAN CARLOS GONZALEZ SANCHEZ

Mais de JUAN CARLOS GONZALEZ SANCHEZ (20)

CONECTIVISMO - sesión 4 - 22023.pptx
CONECTIVISMO - sesión 4 - 22023.pptxCONECTIVISMO - sesión 4 - 22023.pptx
CONECTIVISMO - sesión 4 - 22023.pptx
 
LESSON THREE - A BRIEF HISTORY OF ETHICAL THOUGHT - ETHICAL THEORIES.pptx
LESSON THREE - A BRIEF HISTORY OF ETHICAL THOUGHT - ETHICAL THEORIES.pptxLESSON THREE - A BRIEF HISTORY OF ETHICAL THOUGHT - ETHICAL THEORIES.pptx
LESSON THREE - A BRIEF HISTORY OF ETHICAL THOUGHT - ETHICAL THEORIES.pptx
 
Herencia mendeliana
Herencia mendelianaHerencia mendeliana
Herencia mendeliana
 
La educación universitaria en el siglo xxi
La educación universitaria en el siglo xxiLa educación universitaria en el siglo xxi
La educación universitaria en el siglo xxi
 
Componente biomedica uco - lic educacion fisica recreacion y deportes vr redes
Componente biomedica   uco - lic educacion fisica recreacion y deportes vr redesComponente biomedica   uco - lic educacion fisica recreacion y deportes vr redes
Componente biomedica uco - lic educacion fisica recreacion y deportes vr redes
 
Farmacologia del sistema nervioso tema 8 - vr redes
Farmacologia del sistema nervioso    tema 8 - vr redesFarmacologia del sistema nervioso    tema 8 - vr redes
Farmacologia del sistema nervioso tema 8 - vr redes
 
INTERACCIONES FARMACOLOGICAS - vr redes tema 5
INTERACCIONES FARMACOLOGICAS - vr redes   tema 5INTERACCIONES FARMACOLOGICAS - vr redes   tema 5
INTERACCIONES FARMACOLOGICAS - vr redes tema 5
 
Ancient greek philosophers legacy - vr redes
Ancient greek philosophers   legacy - vr redesAncient greek philosophers   legacy - vr redes
Ancient greek philosophers legacy - vr redes
 
Planificación de programas educativos en salud vr redes
Planificación de programas educativos en salud   vr redesPlanificación de programas educativos en salud   vr redes
Planificación de programas educativos en salud vr redes
 
Sistemas terapeuticos tema 2a - vr redes
Sistemas terapeuticos   tema 2a - vr redesSistemas terapeuticos   tema 2a - vr redes
Sistemas terapeuticos tema 2a - vr redes
 
Vias de administracion de los farmacos vr redes - tema 4
Vias de administracion de los farmacos  vr redes - tema 4Vias de administracion de los farmacos  vr redes - tema 4
Vias de administracion de los farmacos vr redes - tema 4
 
¿QUÉ SON LOS FÁRMACOS? - vr redes
¿QUÉ SON LOS FÁRMACOS? -   vr redes¿QUÉ SON LOS FÁRMACOS? -   vr redes
¿QUÉ SON LOS FÁRMACOS? - vr redes
 
Silogismos ejemplos hw 3rd
Silogismos   ejemplos hw 3rdSilogismos   ejemplos hw 3rd
Silogismos ejemplos hw 3rd
 
Leyes de verdad de las proposiciones opuestas
Leyes de verdad de las proposiciones opuestasLeyes de verdad de las proposiciones opuestas
Leyes de verdad de las proposiciones opuestas
 
Ejemplo de prueba de invalidez
Ejemplo de prueba de invalidezEjemplo de prueba de invalidez
Ejemplo de prueba de invalidez
 
Cuadro ejemplos proposiciones hw 2nd
Cuadro ejemplos proposiciones   hw 2ndCuadro ejemplos proposiciones   hw 2nd
Cuadro ejemplos proposiciones hw 2nd
 
Calculo de consistencia
Calculo de consistenciaCalculo de consistencia
Calculo de consistencia
 
LÓGICA SIMBÓLICA
LÓGICA SIMBÓLICALÓGICA SIMBÓLICA
LÓGICA SIMBÓLICA
 
Logic introduction - aristothelic
Logic   introduction - aristothelicLogic   introduction - aristothelic
Logic introduction - aristothelic
 
Concepto de persona antropologia cristiana vr redes
Concepto de persona   antropologia cristiana vr redesConcepto de persona   antropologia cristiana vr redes
Concepto de persona antropologia cristiana vr redes
 

Analisis De Regresion Y Correlacion

  • 2. Introducción Muchas veces las decisiones se basan en la relación entre dos o más variables.Ejemplos • Dosis de fertilizantes aplicadas y rendimiento del cultivo. • La relación entre la radiación que reciben los sensores con la que se predicen los rendimientos por parcelas con los rendimientos reales observados en dichas parcelas. • Relación entre tamaño de un lote de producción y horas – hombres utilizadas para realizarlo. Distinguiremos entre relaciones funcionales y relaciones estadísticas
  • 3. Relación funcional entre dos variables Una relación funcional se expresa mediante una función matemática. Si X es la variable independiente e Y es la variable dependiente, una relación funcional tiene la forma: Y=f(X) Ejemplo 1 Parcela Dosis Rend.(kg/h) 1 75 150 2 25 50 3 130 260
  • 4. Figura 1 Relación funcional perfecta entre dosis y rendimientos 300 250 Rendimiento 200 150 Rend. 100 50 0 0 20 40 60 80 100 120 140 Dosis Nota: Las observaciones caen exactamente sobre la línea de relación funcional
  • 5. Relación estadística entre dos variables • A diferencia de la relación funcional, no es una relación perfecta, las observaciones no caen exactamente sobre la curva de relación entre las variables Ejemplo 2 Lote de prod. Tamaño del lote Horas hombre 1 30 73 2 20 50 3 60 128 4 80 170 5 40 87
  • 6. Figura 2 Relación estadística entre tamaño del lote y horas hombre 1 80 1 60 Horas hombre 1 40 1 20 1 00 80 Horas hombre 60 40 20 0 0 10 20 30 40 50 60 70 80 90 Tamaño del lote Nota: La mayor parte de los punto no caen directamente sobre la línea de relación estadística. Esta dispersión de punto alrededor de la línea representa la variación aleatoria
  • 7. Figura 3 Coordenadas de puntos de control utilizados para corregir la columna de los niveles digitales de una imagen satelital 7000 6000 5000 4000 3000 2000 1000 0 0 2 4 6 8 10 12 14 16 Nota: se trata de un terreno rugoso donde varían notablemente las condiciones de observación del sensor, para corregir errores geométricos de la imagen, se aplican funciones de segundo grado. Los datos sugieren que la relación estadística es de tipo curvilínea.
  • 8. Conceptos básicos • Análisis de Regresión: Es un procedimiento estadístico que estudia la relación funcional entre variables.Con el objeto de predecir una en función de la/s otra/s. • Análisis de Correlación: Un grupo de técnicas estadísticas usadas para medir la intensidad de la relación entre dos variables • Diagrama de Dispersión: Es un gráfico que muestra la intensidad y el sentido de la relación entre dos variables de interés. • Variable dependiente (respuesta, predicha, endógena): es la variable que se desea predecir o estimar • Variables independientes (predictoras, explicativas exógenas). Son las variables que proveen las bases para estimar. • Regresión simple: interviene una sola variable independiente • Regresión múltiple: intervienen dos o más variables independientes. • Regresión lineal: la función es una combinación lineal de los parámetros. • Regresión no lineal: la función que relaciona los parámetros no es una combinación lineal
  • 9. Gráfico de dispersión Los diagramas de dispersión no sólo muestran la relación existente entre variables, sino también resaltan las observaciones individuales que se desvían de la relación general. Estas observaciones son conocidas como outliers o valores inusitados, que son puntos de los datos que aparecen separados del resto.
  • 10. Coeficiente de correlación lineal • El Coeficiente de Correlación (r) requiere variables medidas en escala de intervalos o de proporciones – Varía entre -1 y 1. – Valores de -1 ó 1 indican correlación perfecta. – Valor igual a 0 indica ausencia de correlación. – Valores negativos indican una relación lineal inversa y valores positivos indican una relación lineal directa
  • 11. Correlación Negativa Perfecta 10 9 8 7 6 Y 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X
  • 12. Correlación Positiva Perfecta 10 9 8 7 6 Y 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X
  • 13. Ausencia de Correlación 10 9 8 7 6 Y 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X
  • 14. Correlación Fuerte y Positiva 10 9 8 7 6 Y 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X
  • 15. Fórmula para el coeficente de correlación (r) Pearson n(ΣXY) (ΣX)(ΣY) r= [ n(ΣX ) (ΣX) ] [ n( ΣY ) ( ΣY) 2 2 2 2 ]
  • 16. Modelos de Regresión Un modelo de regresión, es una manera de expresar dos ingredientes esenciales de una relación estadística: Una tendencia de la variable dependiente Y a variar conjuntamente con la variación de la o las X de una manera sistemática Una dispersión de las observaciones alrededor de la curva de relación estadística
  • 17. Modelos de Regresión Estas dos características están implícitas en un modelo de regresión, postulando que: En la población de observaciones asociadas con el proceso que fue muestreado, hay una distribución de probabilidades de Y para cada nivel de X. Las medias de estas distribuciones varían de manera sistemática al variar X.
  • 18. Representación gráfica del modelo de Regresión Lineal Nota: en esta figura se muestran las distribuciones de probabilidades de Y para distintos valores de X
  • 19. Análisis de Regresión • Objetivo: determinar la ecuación de regresión para predecir los valores de la variable dependiente (Y) en base a la o las variables independientes (X). • Procedimiento: seleccionar una muestra a partir de la población, listar pares de datos para cada observación; dibujar un diagrama de puntos para dar una imagen visual de la relación; determinar la ecuación de regresión.
  • 20. Supuestos de Regresión Lineal Clásica • Cada error está normalmente distribuido con: – Esperanza de los errores igual a 0 – Variancia de los errores igual a una constante σ 2. – Covariancia de los errores nulas para todo i≠j
  • 21. Proceso de estimación de la regresión lineal simple Modelo de regresión Datos de la muestra y=β0+β1x+ε x y x1 y1 Ecuación de regresión x2 y2 E(y)=β0+β1x . . Parámetros desconocidos . . β0.β1 . . xn yn Ecuación estimada de b0 y b1 regresión y=b0+b1x proporcionan estimados Estadísticos de la muestra β0 y β1 b0.b1
  • 22. Líneas posibles de regresión en la regresión lineal simple Sección A Sección B Sección C Relación lineal positiva Relación lineal negativa No hay relación Ey Ey Ey La pendiente β 1 Línea de regresión * es negativa La pendiente β 1 es 0 * La pendiente β 1 * es positiva Línea de regresión Línea de regresión x x x * Ordenada al origen β 0
  • 23. Estimación de la ecuación de Regresión Simple • Y’= a + bX, donde: – Y’ es el valor estimado de Y para distintos X. – a es la intersección o el valor estimado de Y cuando X=0 – b es la pendiente de la línea, o el cambio promedio de Y’ para cada cambio en una unidad de X – el principio de mínimos cuadrados es usado para obtener a y b: n( Σ ) − Σ )( Σ ) XY ( X Y b= n( Σ 2 ) − Σ ) 2 X ( X ΣY ΣX a = − b n n
  • 24. Mínimos cuadrados - Supuestos • El modelo de regresión es lineal en los parámetros. • Los valores de X son fijos en muestreo repetido. • El valor medio de la perturbación εi es igual a cero. • Homocedasticidad o igual variancia de εi. • No autocorrelación entre las perturbaciones. • La covariancia entre εi y Xi es cero. • El número de observaciones n debe ser mayor que el número de parámetros a estimar. • Variabilidad en los valores de X. • El modelo de regresión está correctamente especificado. • No hay relaciones lineales perfectas entre las explicativas.
  • 25. Estimación de la variancia de los términos del error (σ2) Debe ser estimada por varios motivos • Para tener una indicación de la variabilidad de las distribuciones de probabilidad de Y. • Para realizar inferencias con respecto a la función de regresión y la predicción de Y. • La lógica del desarrollo de un estimador de σ 2 para el modelo de regresión es la misma que cuando se muestrea una sola población • La variancia de cada observación Yi es σ 2, la misma que la de cada término del error
  • 26. Estimación de la variancia de los términos del error (σ2) Dado que los Yi provienen de diferentes distribuciones de probabilidades con medias diferentes que dependen del nivel de X, la desviación de una observación Yi debe ser calculada con respecto a su propia media estimada Yi. Por tanto, las desviaciones son los residuales ˆ Yi - Yi = e i Y la suma de cuadrados es: n n n e ˆ SC = ∑ (Y − Y ) = ∑ (Y − a − bX ) = ∑ e i i 2 i 1 2 2 i i =1 i =1 i =1
  • 27. Estimación de la variancia de los términos del error (σ2) La suma de cuadrados del error, tiene n-2 grados de libertad asociados con ella, ya que se tuvieron que estimar dos parámetros. Por lo tanto, las desviaciones al cuadrado dividido por los grados de libertad, se denomina cuadrados medios n 2 SC ∑e CM = = e i =1 i n−2 n−2 e Donde CM es el Cuadrado medio del error o cuadrado medio residual. Es un estimador insesgado de σ 2
  • 28. Análisis de Variancia en el análisis de regresión • El enfoque desde el análisis de variancia se basa en la partición de sumas de cuadrados y grados de libertad asociados con la variable respuesta Y. • La variación de los Yi se mide convencionalmente en términos de las desviaciones (Y − Y ) i i • La medida de la variación total Sctot, es la suma de las desviaciones al cuadrado ∑ (Y − Y ) 2 i i
  • 29. Desarrollo formal de la partición Consideremos la desviación (Y − Y ) i i Podemos descomponerla en (Y i − Y ) = (Y − Y) + (Y − Y ) ˆ i i ˆi T R E (T): desviación total (R): es la desviación del valor ajustado por la regresión con respecto a la media general (E): es la desviación de la observación con respecto a la línea de regresión
  • 30. Desarrollo formal de la partición Si consideremos todas las observaciones y elevamos al cuadrado para que los desvíos no se anulen ∑ ( Y − Y ) = ∑ (Y − Y) + ∑ (Y − Y ) 2 2 i 2 ˆ i ˆi i SCtot SCreg SCer (SCtot): Suma de cuadrados total (SCreg): Suma de cuadrados de la regresión (SCer): Suma de cuadrados del error Dividiendo por los grados de libertad, (n-1), (k) y (n-2), respectivamente cada suma de cuadrados, se obtienen los cuadrados medios del análisis de variancia.
  • 31. Coeficiente de Determinación • Coeficiente de Determinación, R2 - es la proporción de la variación total en la variable dependiente Y que es explicada o contabilizada por la variación en la variable independiente X. – El coeficiente de determinación es el cuadrado del coeficiente de correlación, y varia entre 0 y 1.
  • 32. Cálculo del R2 a través de la siguiente fórmula ∑ (ˆ − y) y 2 R = 2 c ∑ (y − y) 2 o
  • 33. Inferencia en Regresión • Los supuestos que establecimos sobre los errores nos permiten hacer inferencia sobre los parámetros de regresión (prueba de hipòtesis e intervalos de confianza), ya que los estimadores de β0 y β1 pueden cambiar su valor si cambia la muestra. • Por lo tanto debemos conocer la distribución de los estimadores para poder realizar prueba de hipòtesis e intervalos de confianza
  • 34. Ejemplo Se desean comparar los rendimientos predichos a partir de la información obtenida por 3 sensores sobre los rendimientos reales por parcelas de lotes de maíz. Los rendimientos (Y) y el los rindes predichos de 4 sensores se presentan a continuación Sensor 1 Sensor 4 Sensor 5 Rendimiento 0,0754 0,3083 0,1212 42,5846 0,0754 0,3083 0,1212 43,8576 0,0742 0,3327 0,1328 44,0082 0,0766 0,3327 0,1251 43,4989 0,0766 0,3297 0,1251 41,3327 0,0730 0,3205 0,1193 41,0313 0,0754 0,3114 0,1193 40,4802 0,0766 0,2901 0,1193 36,6735 0,0754 0,3449 0,1328 43,3535 0,0754 0,3480 0,1193 43,3180 0,0766 0,3480 0,1193 43,3143 0,0766 0,3419 0,1135 41,0042 0,0766 0,2840 0,1135 36,4908 0,0766 0,3053 0,1193 37,5931 0,0754 0,3266 0,1232 40,4556 0,0766 0,2840 0,1135 35,5595 0,0754 0,3358 0,1232 41,6400 0,0742 0,3419 0,1251 43,5951 ¿Qué sensor refleja mejor el rendimiento de esa zona?
  • 35. Descripción Gráfica y cuantitativa de la relación entre cada sensor y el rendimiento Título PRED_Rendimiento 45,95 38,41 30,87 23,33 15,79 0,078 0,092 0,107 0,121 0,135 B5 Rendimiento PRED_Rendimiento Y = 338.71*X - 4.87 R2 = 0.32
  • 36. PRED_Rendimiento Título 45,95 38,41 30,87 23,33 15,79 0,22 0,26 0,30 0,34 0,37 B4 Rendimiento PRED_Rendimiento Y = 155.37*X – 13.25 R2 = 0.57
  • 37. PRED_Rendimiento Título 45,95 38,41 30,87 23,33 15,79 0,071 0,076 0,081 0,087 0,092 B1 Rendimiento PRED_Rendimiento Y = -1004.34*X +112.24 R2 = 0.44
  • 38. Fuente • file:///C:/Documents%20and %20Settings/Bachi44/Configuraci%F3n %20local/Archivos%20temporales%20de %20Internet/Content.IE5/CPE94BCP/256,1 ,Diapositiva 1