SlideShare uma empresa Scribd logo
1 de 82
Baixar para ler offline
MÉTODOS ESTATÍSTICOS
    E NUMÉRICOS

          UNIDADE 3
        DISTRIBUCIÓNS
       BIDIMENSIONAIS

                     ÍNDICE
   IES Isidro Parga Pondal. Departamento de matemáticas
Conceptos

1. Variables estatísticas bidimensionais.
2.Táboas bidimensionais de frecuencias.
 Diagramas de dispersión.
3. Cálculo de parámetros.
4. Dependencia funcional. Dependencia
 estatística.
5. Correlación.
6. Correlación lineal. Coeficiente de Pearson.
7. Regresión lineal. Rectas de regresión.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución



Cando vemos un rapaz de cinco anos e
dicimos que está moi alto, estamos
comparándoo co talle medio doutros nenos
da mesma idade; é dicir, consideramos
dúas variables, a idade e o talle, e a
relación entre elas.



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución




Precisamente isto é o que imos tratar: a
medida da relación entre dúas variables
para ver o grao de relación que pode
existir entre elas ou como poden influír
unhas sobre outras.



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución

•Neste tema centrarémonos nas
 estatísticas de dúas variables chamadas
 Variables Estatísticas Bidimendionais

•En calquera investigación onde
 observemos dúas variables para o seu
 estudo conxunto, interesa coñecer dúas
 cuestións:

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución


• A posible relación entre as variables e,
 se existe, obter un índice que mida o grao
 desa relación.
     Teoría da Correlación.
•A obtención dunha fórmula que as
 relacione para, se coñecemos o valor
 dunha das variables, poder predicir o
 valor da outra cun determinado erro.
     Teoría da Regresión.
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución



       Pero...........



     Por que se chama Regresión?




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución

As teorías da
correlación e a
regresión son moi
recentes e o seu
descubrimento débese,
en grande parte, ao
médico inglés Sir
Francis Galton
(1.822-1.917).


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución



O contexto histórico que lle tocou vivir
favoreceu o seu interese pola herdanza
xenética: naceu o mesmo ano que George
Mendel, co que mantiña unha grande
afinidade, e ademais era curmán, por
parte de nai, do célebre científico Charles
Darwin.

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución


Estudou a relación entre: estatura media
dun matrimonio - estatura media dos seus
fillos adultos.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución




Encontrou unha correlación forte: canto
maior era a primeira, maior era a segunda.
É dicir, canto máis altos son os pais, máis
altos son os fillos. Pero...




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución

Sostiña a idea de que a pais de estatura moi, moi
elevada corresponden fillos altos, pero non
tanto.
E pais moi baixos acostuman ter fillos baixos,
mais non tan baixos.
Esta observación levou a enunciar a Galton o seu
principio da mediocridade:

“a estatura dos fillos regresa cara a media da
poboación”.


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución




De aí o termo de regresión que,
desde entón, utilízase para
designar unha relación
estatística calquera.



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución


•A observación de Galton é sen dúbida
 certa, pero o suposto da regresión é
 totalmente falso e considérase
 actualmente como a primeira falacia da
 teoría da regresión.
•A xustificación que se dá hoxe a este
 feito é que os valores extremos dunha
 distribución débense en gran parte ao
 chou.
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Introdución

•Os traballos de Galton
 foron continuados, entre
 outros, por Pearson, que
 reelaborou e mellorou as
 súas ideas.

•A Galton e a Pearson
 considéraselles hoxe en
 día os pais da estatística
 moderna.
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Variables estatísticas bidimensionais

Ao efectuar o estudo estatístico dun colectivo
pode ser que en cada observación se considere
un só carácter (peso, estatura, profesión, etc.),
entón temos unha variable estatística
unidimensional.

Se, pola contra, se consideran dous caracteres
dun mesmo individuo (estatura- idade,
profesión- sexo, etc) temos as variables
estatísticas bidimensionais.
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Variables estatísticas bidimensionais

 Formalmente , defínese unha variable
 estatística bidimensional como o par (X,Y),
 onde X representa á primeira variable e Y á
 segunda.
 X e Y non teñen por que ter:
    o mesmo número de valores
    ser da mesma clase
    sendo da mesma clase, unha pode ser continua e
    outra discreta



            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Variables estatísticas bidimensionais



Exemplos:
  Sexo e estado civil
  Peso e altura
  Número de irmáns e idade
  Altura e perímetro torácico



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Variables estatísticas bidimensionais

Sexa a variable (X,Y) que toma os valores
      X={x1,x2,x3,…,xn} Y={y1,y2,y3,…,ym}


Coa expresión (xi,yj) representamos un valor da variable
que terá unha frecuencia absoluta fij que representa o
número de veces que se repite o par (xi,yj) na mostra.


Cando teñamos o mesmo número de observacións para as
variables X e Y, os pares de observacións
denotarémolos por (xi,yi) e a súa frecuencia por fi


             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Táboas bidimensionais de frecuencias.
Diagramas de dispersión



Dependendo das características das dúas
variables estudadas, os datos
represéntanse de diferentes xeitos.
Vexamos os tres tipos máis utilizados de
táboas:




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Táboas bidimensionais de frecuencias.
Diagramas de dispersión

Tipo I (Táboa bidimensional simple)
  Utilízase cando as dúas variables toman
  o mesmo número de valores e cando
  temos poucas observacións


    X    x1         x2             ….              ….. ….                     ….            xn

    Y    y1         y2             …               ….          …..            …..           yn

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Táboas bidimensionais de frecuencias.
  Diagramas de dispersión

   Exemplo:
   A distribución de idades e presión arterial de
   10 persoas é:


Idade (X)     30       28          35           42          51          42          63          32           70   67



Tensión (Y)   11.5     11.3        12.5 13.5 14.6 13                                16.6 12                  16.9 17




                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Táboas bidimensionais de frecuencias.
Diagramas de dispersión

Tipo II (Táboa bidimensional simple con
  frecuencia) Utilízase cando as dúas variables
  toman o mesmo número de valores e temos
  moitas observacións

     X    x1           x2             ……             …..           ……             xn

     Y    y1           y2             …..            .....         ……             yn

     fi   f1           f2             …..            …..           …..            fn
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Táboas bidimensionais de frecuencias.
 Diagramas de dispersión

  Exemplo:
  As cualificacións de 30 alumnos en Historia e
  en Xeografía foron:


 X=nota
               3          4             5            6            6            7             7               8   10
Historia

 Y=nota
               2          5             5            6            7            6             7               9   10
Xeografía
 Número de
alumnos (fi)   4          5             10           2            3            2             1               1   2


                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Táboas bidimensionais de frecuencias.
Diagramas de dispersión

Tipo III (Táboa de dobre entrada)
  Utilízase cando hai un número elevado
  de observacións e ademais o número de
  parellas diferentes é tamén alto. As
  variables poden ter un número diferente
  de valores ou modalidades.
  Podemos atopar exemplos na seguinte
  páxina de internet

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Táboas bidimensionais de frecuencias.
Diagramas de dispersión

Diagramas de dispersión
 A representación gráfica proporciona unha
 imaxe visual que dá unha primeira relación
 entre as variables.
 Para representar unha variable estatística
 bidimensional (X,Y), representamos no eixe
 horizontal os valores de X e no vertical os de
 Y. Obténse un conxunto de puntos sobre o
 plano que se denomina diagrama de dispersión
 ou nube de puntos.
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Táboas bidimensionais de frecuencias.
Diagramas de dispersión
Vexamos un exemplo
Na web do IGE (Instituto Galego de Estatística) podemos ver unha
táboa que reflite a distribución conxunta das variables:
  -Renda por habitante.
  -Número de vehículos turismo por cada 1000 habitantes de todos
   os concellos da Coruña.




              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Cálculo de parámetros

Dada unha variable estatística bidimensional (X,Y), as
distribucións X e Y estudadas por separado chámanse
distribucións marxinais.
Para cada unha destas variables, pódese calcular os
parámetros media, varianza e desviación típica.

Definiremos un parámetro conxunto para ambas variables:
A COVARIANZA
               n                                                    n

              ∑( x       1   − x ) ⋅ ( yi − y ) ⋅ f i             ∑x ⋅y ⋅ fi       i     i
     S XY =   i =1
                                                              =    i =1
                                                                                             −x⋅y
                                    N                                          N

                     IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Cálculo de parámetros

A relación entre dúas variables pode ser:
 Dependencia unilateral: A primeira variable
  inflúe sobre a segunda, pero a segunda non
  inflúe sobre a primeira. O consumo de alcohol
  inflúe sobre o número de accidentes de
  tráfico, pero non ao revés.
 Dependencia mutua: Unha variable inflúe
  sobre a outra e viceversa. O prezo dun
  produto e a demanda del.


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Cálculo de parámetros

 Dependencia non observable: Unha variable inflúe
  sobre a outra pero a través dunha variable que non
  observamos directamente. O número de ordenadores
  ten relación co número de accidentes; existe unha
  variable non observada que é o nivel de vida que fai
  que haxa máis coches onde hai máis ordenadores.

 Dependencia espuria: Prodúcese cando nun
  determinado estudo illado, entre dúas variables hai
  unha relación debida a unha casualidade, á
  manipulación aritmética dos datos ou inclusive ser
  provocada polo observador que colle só os datos que
  lle interesan. Nun estudo feito en Babiera, G.M.
  Jenkins obtivo unha altísima relación entre o número
  de nacementos e o número de cegoñas.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Dependencia funcional. Dependencia estatística


Imos ver que a relación que se pode dar
entre dúas variables pode ser de dous
tipos.

Vexamos dous casos:




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Dependencia funcional. Dependencia estatística

CASO 1: Se un automobilista conduce
durante unha hora, percorrerá tantos máis km
canto maior sexa a súa velocidade.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Dependencia funcional. Dependencia estatística

CASO 1
  As variables:
        espazo percorrido – velocidade
  están claramente relacionadas, e hai unha
  fórmula coa que podemos calcular,
  exactamente, o espazo en función da
  velocidade.

   Diremos entón que neste caso a relación
   entre as dúas variables é funcional.

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Dependencia funcional. Dependencia estatística

 CASO 2: As persoas, en xeral, pesan
 máis canto máis altas son.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Dependencia funcional. Dependencia estatística

CASO 2
  As variables:
               peso – estatura
   tamén están relacionadas, pero non se pode
   dar unha fórmula que permita obter o peso
   dunha persoa coñecendo a súa estatura.

   Neste caso dise que entre as variables hai
   unha relación estatística ou correlación.

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Dependencia funcional. Dependencia estatística




O obxecto do noso estudo é a
  relación estatística ou
         correlación


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación


Defínese a correlación entre dúas
variables como a relación ou
interdependencia que existe entre elas; a
modificación nunha das variables
produce o cambio da outra.

A relación estatística pode ser positiva
ou negativa e tamén pode ser forte ou
débil.
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación


Nos exemplos seguintes debes dicir se,
entre as dúas variables:

 Hai relación ou non.
 Se a hai, se é funcional ou relación
estatística (correlación).
 Neste último caso, indicar se é positiva
ou negativa, forte ou débil.

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación

EXEMPLO 1:
  Velocidade coa que se lanza unha pedra cara
  arriba- Altura que alcanza




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación

EXEMPLO 2: Talle de zapatos–estatura




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación


EXEMPLO 3: Raio da circunferencia –
Lonxitude da circunferencia




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación


   EXEMPLO 4
     Índice de
     mortalidade
     infantil dun país
     – nº de médicos
     por cada 1000
     habitantes.


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación


EXEMPLO 5: Kwh consumidos nunha
vivenda en outubro – custo do recibo da luz




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación

EXEMPLO 6: Nº de persoas que viven
nunha casa – custo do recibo da luz




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación




 Pero, como podemos saber, dun xeito
 fiable, se dúas variables están
 relacionadas?




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación




 Podemos intentalo estudando as nubes
 de puntos da variable bidimensional
 correspondente.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación


Nos gráficos 1 e 4 a medida que aumenta
a variable X, aumenta a variable Y.
Diremos que entre as variables existe
unha correlación directa ou positiva.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación


Nos gráficos 2 e 3, obsérvase que a
medida que aumenta a variable X, diminúe
a variable Y. Diremos que existe unha
correlación inversa ou negativa.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación

 Nos gráficos 1 e 2 observamos que os puntos
 da nube se poden condensar arredor dunha
 recta. Diremos que entre as variables existe
 unha correlación lineal.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación

Nos gráficos 3 e 4, obsérvase que os puntos da
nube non se poden condensar arredor dunha
recta, senón a unha curva. Diremos que existe
unha correlación curvilínea.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación

No gráfico 5 observamos que non se pode
establecer unha relación entre as variables.
Diremos que as variables son incorreladas.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Correlación


 Para mellorar o estudo gráfico
 proporcionado pola nube de puntos
 dunha variable estatística bidimensional
 definimos o coeficiente de correlación
 lineal de Pearson.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Correlación lineal. Coeficiente de Pearson



 O coeficiente de correlación de Pearson
 defínese mediante a seguinte expresión:
                                          sendo
          S xy                            Sxy a covarianza da variable
   r=                                     bidimensional (X,Y)
        Sx ⋅ S y                          Sx a desviación típica de X
                                          Sy a desviación típica de Y




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Correlación lineal. Coeficiente de Pearson

    O coeficiente de correlación lineal de
    Pearson é un número, represéntase por r e
    cumpre:

•   Está comprendido entre -1 e 1.
•   r = 1 corresponde á maior correlación
    positiva, neste caso entre as variables hai
    unha relación funcional.
•   r = -1 corresponde á maior correlación
    negativa, neste caso entre as variables hai
    unha relación funcional.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Correlación lineal. Coeficiente de Pearson

•Se r é próximo a 1: o axuste é aceptablemente bo,
 distribuíndose as observacións (xi, yi) ao redor dunha
 recta crecente, a correlación entre as variables é
 positiva e forte.

•Se r é próximo a -1: o axuste é aceptablemente bo,
 distribuíndose as observacións (xi, yi) ao redor dunha
 recta decrecente, a correlación entre as variables é
 negativa e forte.

•Se r é próximo a 0: o axuste non é aceptable,
 indicando que non existe relación lineal entre as
 variables ou é débil.


             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Correlación lineal. Coeficiente de Pearson

EXEMPLO:
Os seguintes coeficientes de correlación
-0,73 ; 0,69 ; - 0,98 corresponden ás variables do
primeiro exemplo:
Á vista dos gráficos asígnalle a cada par de variables a
súa correlación.




             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


 Defínese a teoría de regresión entre
 dúas variables como unha parte da
 Estatística que trata de condensar a
 nube de puntos mediante unha función
 matemática coñecida para achar o valor
 dunha das variables coñecido o valor da
 outra.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


 Entre todas as funcións matemáticas que
 se poidan axustar a unha nube de puntos,
 escolleremos a que mellor se adapte aos
 puntos e a que permita facer as
 predicións máis fiables.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

 As funcións máis utilizadas para facer
 regresións son:

        Recta
        Parábola
        Exponencial



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


 Neste tema, centrarémonos na Regresión
 Linear.

 O noso problema será obter a ecuación
 da recta y=ax+b, que mellor se adapte á
 nube de puntos.



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


 O método matemático que nos
 permite calcular esta recta é o
 Método dos Mínimos Cadrados e a
 recta así obtida chámase Recta de
 Regresión.
 Vexámolo graficamente


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

                                                       S XY
  Recta de regresión
de y sobre x
                                                y − y = 2 ( x − x)
                                                       SX

  Recta de regresión                                    S XY
de x sobre y                                     x − x = 2 ( y − y)
                                                        Sy
Vexámolo graficamente:

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

Vexamos un exemplo:
O ESTUDO, A TELE E O NÚMERO DE SUSPENSOS




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

Un psicólogo escolar ten a sospeita de que
os alumnos que estudan un número moi
reducido de horas dedican, en cambio,
moitas horas a ver a televisión e
obteñen malas notas.

Quere probar se a súa sospeita é certa.

Organiza o traballo do seguinte xeito:

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


PASO 1:
Decide que variables vai estudar. Neste
caso son tres para cada alumno: Horas de
estudo – Horas de tv. – Nº de suspensos,
vai estudar a relación entre cada dúas:

  • Horas de estudo – Horas de tv
  • Horas de estudo – Nº de suspensos
  • Horas de tv – Nº de suspensos
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

PASO 2: Como non vai estudar a todos os
alumnos da cidade (son demasiados) escolle ao
azar 15, é o que se chama unha mostra.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

PASO 3: Pásalles unha enquisa na que lles
pregunta a cada un o nº de horas que
dedican ao estudo e á tv, e o nº de
suspensos.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

PASO 4:Recolle os datos nunha táboa
Alumno nº Nº horas de estudo                        N horas TV                        Nº de suspensos
1         4                                         2                                   1
2         5                                         1.5                                 0
3         4                                         2.5                                 3
4         2.5                                       4                                   2
5         6                                         0.5                                 0
6         0.5                                       5.5                                 6
7         1                                         5                                   2
8         2                                         4                                   5
9         3                                         2.5                                 3
10        4.5                                       1.5                                 2
11        3                                         3.5                                 4
12        1.5                                       5                                   3
13        3.5                                       2.5                                 4
14        5.5                                       1                                   1
15        2.5                                       3.5                                 3
             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


PASO 5:
Representa en diagramas cartesianos os
pares de variables seguintes:

      Horas de estudo – Horas de tv
      Horas de estudo – Nº de suspensos
      Horas de tv – Nº de suspensos



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


 Horas de estudo – Horas de televisión




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8.-Regresión linear. Rectas de regresión


Horas de estudo – Número de suspensos




          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8.-Regresión linear. Rectas de regresión

Horas de televisión – Número de suspensos




          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión




 Observa os diagramas e trata
 de contestar ás cuestións




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

Existe relación entre as variables?
Entre cales che parece que a correlación é máis forte? ,
e máis débil?
Poderías distinguir, nos diagramas, entre a correlación
positiva e a negativa?




             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

Podemos calcular, con certa aproximación, cantas horas
dedicará ao estudo Xan, sabendo que dedica 3 a ver a
televisión?
E cantos suspensos terá?




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


 Podemos responder mellor a estas
 preguntas se axustamos unha recta aos
 puntos, debuxamos unha recta que se
 aproxime o mellor posible; é dicir,
 calculamos a
          recta de regresión




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

Podemos calcular, con certa aproximación, cantas horas
dedicará ao estudo Xan, sabendo que dedica 3 a ver a
televisión?
E cantos suspensos terá?




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

EXEMPLO: Vimos a nube de puntos que representaba a
distribución conxunta das variables:
   -Renda por habitante.
   -Número de vehículos turismo por cada 1000 habitantes de todos
    os concellos da Coruña.
Existirá algún tipo de relación entre esas dúas variables?




               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


 Existe unha certa correlación linear e
 positiva




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión

 Para isto axúdanos a recta de regresión




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Regresión linear. Rectas de regresión


 Podemos ver que serían,
 aproximadamente, 400 vehículos.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Mais conteúdo relacionado

Mais de German Mendez

8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormal8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormalGerman Mendez
 
6.probabilidadecondicionada
6.probabilidadecondicionada6.probabilidadecondicionada
6.probabilidadecondicionadaGerman Mendez
 
5.cálculodeprobabilidades
5.cálculodeprobabilidades5.cálculodeprobabilidades
5.cálculodeprobabilidadesGerman Mendez
 
4.técnicasdereconto
4.técnicasdereconto4.técnicasdereconto
4.técnicasderecontoGerman Mendez
 
2.medidasdecentralizacióneposición
2.medidasdecentralizacióneposición2.medidasdecentralizacióneposición
2.medidasdecentralizacióneposiciónGerman Mendez
 
1.iniciaciónáestatística
1.iniciaciónáestatística1.iniciaciónáestatística
1.iniciaciónáestatísticaGerman Mendez
 

Mais de German Mendez (8)

9.mostraxe
9.mostraxe9.mostraxe
9.mostraxe
 
8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormal8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormal
 
6.probabilidadecondicionada
6.probabilidadecondicionada6.probabilidadecondicionada
6.probabilidadecondicionada
 
5.cálculodeprobabilidades
5.cálculodeprobabilidades5.cálculodeprobabilidades
5.cálculodeprobabilidades
 
4.técnicasdereconto
4.técnicasdereconto4.técnicasdereconto
4.técnicasdereconto
 
2.medidasdecentralizacióneposición
2.medidasdecentralizacióneposición2.medidasdecentralizacióneposición
2.medidasdecentralizacióneposición
 
1.iniciaciónáestatística
1.iniciaciónáestatística1.iniciaciónáestatística
1.iniciaciónáestatística
 
Indice
IndiceIndice
Indice
 

3.distribuciónsbidimensionais

  • 1. MÉTODOS ESTATÍSTICOS E NUMÉRICOS UNIDADE 3 DISTRIBUCIÓNS BIDIMENSIONAIS ÍNDICE IES Isidro Parga Pondal. Departamento de matemáticas
  • 2. Conceptos 1. Variables estatísticas bidimensionais. 2.Táboas bidimensionais de frecuencias. Diagramas de dispersión. 3. Cálculo de parámetros. 4. Dependencia funcional. Dependencia estatística. 5. Correlación. 6. Correlación lineal. Coeficiente de Pearson. 7. Regresión lineal. Rectas de regresión. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 3. 1. Introdución Cando vemos un rapaz de cinco anos e dicimos que está moi alto, estamos comparándoo co talle medio doutros nenos da mesma idade; é dicir, consideramos dúas variables, a idade e o talle, e a relación entre elas. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 4. 1. Introdución Precisamente isto é o que imos tratar: a medida da relación entre dúas variables para ver o grao de relación que pode existir entre elas ou como poden influír unhas sobre outras. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 5. 1. Introdución •Neste tema centrarémonos nas estatísticas de dúas variables chamadas Variables Estatísticas Bidimendionais •En calquera investigación onde observemos dúas variables para o seu estudo conxunto, interesa coñecer dúas cuestións: IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 6. 1. Introdución • A posible relación entre as variables e, se existe, obter un índice que mida o grao desa relación. Teoría da Correlación. •A obtención dunha fórmula que as relacione para, se coñecemos o valor dunha das variables, poder predicir o valor da outra cun determinado erro. Teoría da Regresión. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 7. 1. Introdución Pero........... Por que se chama Regresión? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 8. 1. Introdución As teorías da correlación e a regresión son moi recentes e o seu descubrimento débese, en grande parte, ao médico inglés Sir Francis Galton (1.822-1.917). IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 9. 1. Introdución O contexto histórico que lle tocou vivir favoreceu o seu interese pola herdanza xenética: naceu o mesmo ano que George Mendel, co que mantiña unha grande afinidade, e ademais era curmán, por parte de nai, do célebre científico Charles Darwin. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 10. 1. Introdución Estudou a relación entre: estatura media dun matrimonio - estatura media dos seus fillos adultos. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 11. 1. Introdución Encontrou unha correlación forte: canto maior era a primeira, maior era a segunda. É dicir, canto máis altos son os pais, máis altos son os fillos. Pero... IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 12. 1. Introdución Sostiña a idea de que a pais de estatura moi, moi elevada corresponden fillos altos, pero non tanto. E pais moi baixos acostuman ter fillos baixos, mais non tan baixos. Esta observación levou a enunciar a Galton o seu principio da mediocridade: “a estatura dos fillos regresa cara a media da poboación”. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 13. 1. Introdución De aí o termo de regresión que, desde entón, utilízase para designar unha relación estatística calquera. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 14. 1. Introdución •A observación de Galton é sen dúbida certa, pero o suposto da regresión é totalmente falso e considérase actualmente como a primeira falacia da teoría da regresión. •A xustificación que se dá hoxe a este feito é que os valores extremos dunha distribución débense en gran parte ao chou. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 15. 1. Introdución •Os traballos de Galton foron continuados, entre outros, por Pearson, que reelaborou e mellorou as súas ideas. •A Galton e a Pearson considéraselles hoxe en día os pais da estatística moderna. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 16. 2. Variables estatísticas bidimensionais Ao efectuar o estudo estatístico dun colectivo pode ser que en cada observación se considere un só carácter (peso, estatura, profesión, etc.), entón temos unha variable estatística unidimensional. Se, pola contra, se consideran dous caracteres dun mesmo individuo (estatura- idade, profesión- sexo, etc) temos as variables estatísticas bidimensionais. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 17. 2. Variables estatísticas bidimensionais Formalmente , defínese unha variable estatística bidimensional como o par (X,Y), onde X representa á primeira variable e Y á segunda. X e Y non teñen por que ter:  o mesmo número de valores  ser da mesma clase  sendo da mesma clase, unha pode ser continua e outra discreta IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 18. 2. Variables estatísticas bidimensionais Exemplos: Sexo e estado civil Peso e altura Número de irmáns e idade Altura e perímetro torácico IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 19. 2. Variables estatísticas bidimensionais Sexa a variable (X,Y) que toma os valores X={x1,x2,x3,…,xn} Y={y1,y2,y3,…,ym} Coa expresión (xi,yj) representamos un valor da variable que terá unha frecuencia absoluta fij que representa o número de veces que se repite o par (xi,yj) na mostra. Cando teñamos o mesmo número de observacións para as variables X e Y, os pares de observacións denotarémolos por (xi,yi) e a súa frecuencia por fi IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 20. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersión Dependendo das características das dúas variables estudadas, os datos represéntanse de diferentes xeitos. Vexamos os tres tipos máis utilizados de táboas: IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 21. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersión Tipo I (Táboa bidimensional simple) Utilízase cando as dúas variables toman o mesmo número de valores e cando temos poucas observacións X x1 x2 …. ….. …. …. xn Y y1 y2 … …. ….. ….. yn IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 22. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersión Exemplo: A distribución de idades e presión arterial de 10 persoas é: Idade (X) 30 28 35 42 51 42 63 32 70 67 Tensión (Y) 11.5 11.3 12.5 13.5 14.6 13 16.6 12 16.9 17 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 23. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersión Tipo II (Táboa bidimensional simple con frecuencia) Utilízase cando as dúas variables toman o mesmo número de valores e temos moitas observacións X x1 x2 …… ….. …… xn Y y1 y2 ….. ..... …… yn fi f1 f2 ….. ….. ….. fn IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 24. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersión Exemplo: As cualificacións de 30 alumnos en Historia e en Xeografía foron: X=nota 3 4 5 6 6 7 7 8 10 Historia Y=nota 2 5 5 6 7 6 7 9 10 Xeografía Número de alumnos (fi) 4 5 10 2 3 2 1 1 2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 25. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersión Tipo III (Táboa de dobre entrada) Utilízase cando hai un número elevado de observacións e ademais o número de parellas diferentes é tamén alto. As variables poden ter un número diferente de valores ou modalidades. Podemos atopar exemplos na seguinte páxina de internet IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 26. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersión Diagramas de dispersión A representación gráfica proporciona unha imaxe visual que dá unha primeira relación entre as variables. Para representar unha variable estatística bidimensional (X,Y), representamos no eixe horizontal os valores de X e no vertical os de Y. Obténse un conxunto de puntos sobre o plano que se denomina diagrama de dispersión ou nube de puntos. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 27. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersión Vexamos un exemplo Na web do IGE (Instituto Galego de Estatística) podemos ver unha táboa que reflite a distribución conxunta das variables: -Renda por habitante. -Número de vehículos turismo por cada 1000 habitantes de todos os concellos da Coruña. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 28. 4. Cálculo de parámetros Dada unha variable estatística bidimensional (X,Y), as distribucións X e Y estudadas por separado chámanse distribucións marxinais. Para cada unha destas variables, pódese calcular os parámetros media, varianza e desviación típica. Definiremos un parámetro conxunto para ambas variables: A COVARIANZA n n ∑( x 1 − x ) ⋅ ( yi − y ) ⋅ f i ∑x ⋅y ⋅ fi i i S XY = i =1 = i =1 −x⋅y N N IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 29. 4. Cálculo de parámetros A relación entre dúas variables pode ser:  Dependencia unilateral: A primeira variable inflúe sobre a segunda, pero a segunda non inflúe sobre a primeira. O consumo de alcohol inflúe sobre o número de accidentes de tráfico, pero non ao revés.  Dependencia mutua: Unha variable inflúe sobre a outra e viceversa. O prezo dun produto e a demanda del. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 30. 4. Cálculo de parámetros  Dependencia non observable: Unha variable inflúe sobre a outra pero a través dunha variable que non observamos directamente. O número de ordenadores ten relación co número de accidentes; existe unha variable non observada que é o nivel de vida que fai que haxa máis coches onde hai máis ordenadores.  Dependencia espuria: Prodúcese cando nun determinado estudo illado, entre dúas variables hai unha relación debida a unha casualidade, á manipulación aritmética dos datos ou inclusive ser provocada polo observador que colle só os datos que lle interesan. Nun estudo feito en Babiera, G.M. Jenkins obtivo unha altísima relación entre o número de nacementos e o número de cegoñas. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 31. 5. Dependencia funcional. Dependencia estatística Imos ver que a relación que se pode dar entre dúas variables pode ser de dous tipos. Vexamos dous casos: IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 32. 5. Dependencia funcional. Dependencia estatística CASO 1: Se un automobilista conduce durante unha hora, percorrerá tantos máis km canto maior sexa a súa velocidade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 33. 5. Dependencia funcional. Dependencia estatística CASO 1 As variables: espazo percorrido – velocidade están claramente relacionadas, e hai unha fórmula coa que podemos calcular, exactamente, o espazo en función da velocidade. Diremos entón que neste caso a relación entre as dúas variables é funcional. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 34. 5. Dependencia funcional. Dependencia estatística CASO 2: As persoas, en xeral, pesan máis canto máis altas son. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 35. 5. Dependencia funcional. Dependencia estatística CASO 2 As variables: peso – estatura tamén están relacionadas, pero non se pode dar unha fórmula que permita obter o peso dunha persoa coñecendo a súa estatura. Neste caso dise que entre as variables hai unha relación estatística ou correlación. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 36. 5. Dependencia funcional. Dependencia estatística O obxecto do noso estudo é a relación estatística ou correlación IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 37. 6. Correlación Defínese a correlación entre dúas variables como a relación ou interdependencia que existe entre elas; a modificación nunha das variables produce o cambio da outra. A relación estatística pode ser positiva ou negativa e tamén pode ser forte ou débil. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 38. 6. Correlación Nos exemplos seguintes debes dicir se, entre as dúas variables: Hai relación ou non. Se a hai, se é funcional ou relación estatística (correlación). Neste último caso, indicar se é positiva ou negativa, forte ou débil. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 39. 6. Correlación EXEMPLO 1: Velocidade coa que se lanza unha pedra cara arriba- Altura que alcanza IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 40. 6. Correlación EXEMPLO 2: Talle de zapatos–estatura IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 41. 6. Correlación EXEMPLO 3: Raio da circunferencia – Lonxitude da circunferencia IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 42. 6. Correlación EXEMPLO 4 Índice de mortalidade infantil dun país – nº de médicos por cada 1000 habitantes. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 43. 6. Correlación EXEMPLO 5: Kwh consumidos nunha vivenda en outubro – custo do recibo da luz IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 44. 6. Correlación EXEMPLO 6: Nº de persoas que viven nunha casa – custo do recibo da luz IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 45. 6. Correlación Pero, como podemos saber, dun xeito fiable, se dúas variables están relacionadas? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 46. 6. Correlación Podemos intentalo estudando as nubes de puntos da variable bidimensional correspondente. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 47. 6. Correlación IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 48. 6. Correlación Nos gráficos 1 e 4 a medida que aumenta a variable X, aumenta a variable Y. Diremos que entre as variables existe unha correlación directa ou positiva. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 49. 6. Correlación Nos gráficos 2 e 3, obsérvase que a medida que aumenta a variable X, diminúe a variable Y. Diremos que existe unha correlación inversa ou negativa. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 50. 6. Correlación Nos gráficos 1 e 2 observamos que os puntos da nube se poden condensar arredor dunha recta. Diremos que entre as variables existe unha correlación lineal. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 51. 6. Correlación Nos gráficos 3 e 4, obsérvase que os puntos da nube non se poden condensar arredor dunha recta, senón a unha curva. Diremos que existe unha correlación curvilínea. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 52. 6. Correlación No gráfico 5 observamos que non se pode establecer unha relación entre as variables. Diremos que as variables son incorreladas. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 53. 6. Correlación Para mellorar o estudo gráfico proporcionado pola nube de puntos dunha variable estatística bidimensional definimos o coeficiente de correlación lineal de Pearson. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 54. 7. Correlación lineal. Coeficiente de Pearson O coeficiente de correlación de Pearson defínese mediante a seguinte expresión: sendo S xy Sxy a covarianza da variable r= bidimensional (X,Y) Sx ⋅ S y Sx a desviación típica de X Sy a desviación típica de Y IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 55. 7. Correlación lineal. Coeficiente de Pearson O coeficiente de correlación lineal de Pearson é un número, represéntase por r e cumpre: • Está comprendido entre -1 e 1. • r = 1 corresponde á maior correlación positiva, neste caso entre as variables hai unha relación funcional. • r = -1 corresponde á maior correlación negativa, neste caso entre as variables hai unha relación funcional. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 56. 7. Correlación lineal. Coeficiente de Pearson •Se r é próximo a 1: o axuste é aceptablemente bo, distribuíndose as observacións (xi, yi) ao redor dunha recta crecente, a correlación entre as variables é positiva e forte. •Se r é próximo a -1: o axuste é aceptablemente bo, distribuíndose as observacións (xi, yi) ao redor dunha recta decrecente, a correlación entre as variables é negativa e forte. •Se r é próximo a 0: o axuste non é aceptable, indicando que non existe relación lineal entre as variables ou é débil. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 57. 7. Correlación lineal. Coeficiente de Pearson EXEMPLO: Os seguintes coeficientes de correlación -0,73 ; 0,69 ; - 0,98 corresponden ás variables do primeiro exemplo: Á vista dos gráficos asígnalle a cada par de variables a súa correlación. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 58. 8. Regresión linear. Rectas de regresión Defínese a teoría de regresión entre dúas variables como unha parte da Estatística que trata de condensar a nube de puntos mediante unha función matemática coñecida para achar o valor dunha das variables coñecido o valor da outra. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 59. 8. Regresión linear. Rectas de regresión Entre todas as funcións matemáticas que se poidan axustar a unha nube de puntos, escolleremos a que mellor se adapte aos puntos e a que permita facer as predicións máis fiables. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 60. 8. Regresión linear. Rectas de regresión As funcións máis utilizadas para facer regresións son: Recta Parábola Exponencial IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 61. 8. Regresión linear. Rectas de regresión Neste tema, centrarémonos na Regresión Linear. O noso problema será obter a ecuación da recta y=ax+b, que mellor se adapte á nube de puntos. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 62. 8. Regresión linear. Rectas de regresión O método matemático que nos permite calcular esta recta é o Método dos Mínimos Cadrados e a recta así obtida chámase Recta de Regresión. Vexámolo graficamente IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 63. 8. Regresión linear. Rectas de regresión S XY Recta de regresión de y sobre x y − y = 2 ( x − x) SX Recta de regresión S XY de x sobre y x − x = 2 ( y − y) Sy Vexámolo graficamente: IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 64. 8. Regresión linear. Rectas de regresión Vexamos un exemplo: O ESTUDO, A TELE E O NÚMERO DE SUSPENSOS IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 65. 8. Regresión linear. Rectas de regresión Un psicólogo escolar ten a sospeita de que os alumnos que estudan un número moi reducido de horas dedican, en cambio, moitas horas a ver a televisión e obteñen malas notas. Quere probar se a súa sospeita é certa. Organiza o traballo do seguinte xeito: IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 66. 8. Regresión linear. Rectas de regresión PASO 1: Decide que variables vai estudar. Neste caso son tres para cada alumno: Horas de estudo – Horas de tv. – Nº de suspensos, vai estudar a relación entre cada dúas: • Horas de estudo – Horas de tv • Horas de estudo – Nº de suspensos • Horas de tv – Nº de suspensos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 67. 8. Regresión linear. Rectas de regresión PASO 2: Como non vai estudar a todos os alumnos da cidade (son demasiados) escolle ao azar 15, é o que se chama unha mostra. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 68. 8. Regresión linear. Rectas de regresión PASO 3: Pásalles unha enquisa na que lles pregunta a cada un o nº de horas que dedican ao estudo e á tv, e o nº de suspensos. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 69. 8. Regresión linear. Rectas de regresión PASO 4:Recolle os datos nunha táboa Alumno nº Nº horas de estudo N horas TV Nº de suspensos 1 4 2 1 2 5 1.5 0 3 4 2.5 3 4 2.5 4 2 5 6 0.5 0 6 0.5 5.5 6 7 1 5 2 8 2 4 5 9 3 2.5 3 10 4.5 1.5 2 11 3 3.5 4 12 1.5 5 3 13 3.5 2.5 4 14 5.5 1 1 15 2.5 3.5 3 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 70. 8. Regresión linear. Rectas de regresión PASO 5: Representa en diagramas cartesianos os pares de variables seguintes: Horas de estudo – Horas de tv Horas de estudo – Nº de suspensos Horas de tv – Nº de suspensos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 71. 8. Regresión linear. Rectas de regresión Horas de estudo – Horas de televisión IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 72. 8.-Regresión linear. Rectas de regresión Horas de estudo – Número de suspensos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 73. 8.-Regresión linear. Rectas de regresión Horas de televisión – Número de suspensos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 74. 8. Regresión linear. Rectas de regresión Observa os diagramas e trata de contestar ás cuestións IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 75. 8. Regresión linear. Rectas de regresión Existe relación entre as variables? Entre cales che parece que a correlación é máis forte? , e máis débil? Poderías distinguir, nos diagramas, entre a correlación positiva e a negativa? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 76. 8. Regresión linear. Rectas de regresión Podemos calcular, con certa aproximación, cantas horas dedicará ao estudo Xan, sabendo que dedica 3 a ver a televisión? E cantos suspensos terá? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 77. 8. Regresión linear. Rectas de regresión Podemos responder mellor a estas preguntas se axustamos unha recta aos puntos, debuxamos unha recta que se aproxime o mellor posible; é dicir, calculamos a recta de regresión IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 78. 8. Regresión linear. Rectas de regresión Podemos calcular, con certa aproximación, cantas horas dedicará ao estudo Xan, sabendo que dedica 3 a ver a televisión? E cantos suspensos terá? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 79. 8. Regresión linear. Rectas de regresión EXEMPLO: Vimos a nube de puntos que representaba a distribución conxunta das variables: -Renda por habitante. -Número de vehículos turismo por cada 1000 habitantes de todos os concellos da Coruña. Existirá algún tipo de relación entre esas dúas variables? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 80. 8. Regresión linear. Rectas de regresión Existe unha certa correlación linear e positiva IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 81. 8. Regresión linear. Rectas de regresión Para isto axúdanos a recta de regresión IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 82. 8. Regresión linear. Rectas de regresión Podemos ver que serían, aproximadamente, 400 vehículos. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.