REGRESSÃO LINEAR SIMPLES
Mario Andrade Lira Junior
www.lira.pro.brwordpress
Direitos autorais reservados segundo licença Creative Commons
3.0: com Atribuição; Não Comercial; Compartilha Igual
TERMOS

IMPORTANTES
5/1/2014

Tipos de variáveis
 Qualitativa x Quantitativa
 Dependente x Independente
 Regressão
 Correlação
 Relação causa-efeito
 Extrapolação x Interpolação
 Valor ajustado - estimativa da população
 Resíduo- diferença entre ajustado e real (variação do
acaso)


Material didático Estatística Aplicada à
Agricultura, 2013-2.

2
REGRESSÃO

X

CORRELAÇÃO
5/1/2014

Diferença
 Regressão - equação ligando duas ou mais variáveis
 Correlação – medida do grau de ligação entre duas
variáveis
 Usos
 Regressão – interpolares valores na faixa usada no
experimento
 Correlação – indicar variáveis com comportamento
semelhante


Material didático Estatística Aplicada à
Agricultura, 2013-2.

3
COEFICIENTES

Material didático Estatística Aplicada à
Agricultura, 2013-2.



Correlação (r)
 Mede o grau de relação entre variáveis
 Faixa de valores
 0 a 1
 Positivo ou negativo
 Interpretação
 Quanto mais próximo de 1/-1, maior a ligação entre as
variáveis
Determinação (r²)
 Quanto a regressão explica dos dados
 Faixa de valores
 0 a 1
 Interpretação
 Quanto maior, mais a regressão explica

5/1/2014



4
5/1/2014

- variável independente
 Médias

Material didático Estatística Aplicada à
Agricultura, 2013-2.

 Acaso

DE VARIAÇÃO

CAUSAS

5
REQUISITOS
independente medida sem erro

Ou seja, só tem variação do acaso para Y

Y

pode ser explicado por reta em função de X
 Para cada X os Y´s são



Independentes, ou seja, variação do acaso
independente
Resíduos com média zero

 Homocedase

Material didático Estatística Aplicada à
Agricultura, 2013-2.



5/1/2014

 Variável

6
DE UMA REGRESSÃO LINEAR SIMPLES

“LEITURA”

5/1/2014



Material didático Estatística Aplicada à
Agricultura, 2013-2.

7
90
80
70

5/1/2014

y = 1,14+7,88x
R² = 0,94
Triângulo

60

Material didático Estatística Aplicada à
Agricultura, 2013-2.

y = 8,45+5,69x
R² = 0,99
Quadrados

50
40

y = 2,32+1,99x
R² = 0,98
Losangos

30
20
10
0

0

1

2

3

4

5

6

7

8

9

Figura 1 – Representação esquemática de três regressões lineares simples aleatórias, para
interpretação dos coeficientes

10

8
EQUAÇÕES PARA CÁLCULO DA REGRESSÃO
x )(

5/1/2014

(

y)

N
r
x

(

2

x)

2

y

N

(

xy
b
x

2

x )(
N
2
(
x)

2

(

y)
N

y)

2

Material didático Estatística Aplicada à
Agricultura, 2013-2.

xy

N

a

y

bx

9
UM

SATURNO EM 2100

ADUBAÇÃO
NITROGENADA, COM
OS TRATAMENTOS E
RESULTADOS ABAIXO.
CALCULE A
REGRESSÃO ENTRE AS
DUAS VARIÁVEIS

Material didático Estatística Aplicada à
Agricultura, 2013-2.

AVALIANDO A
RESPOSTA DE CANA
DE AÇÚCAR À

Produtividade (t.ha-1)
64,64
75,06
88,14
105,71
88,88
109,85
130,66
152,69
113,12
146,47
170,06
211,42
153,52
177,59
207,39
246,65
185,84
216,04
248,87
293,63

5/1/2014

EXPERIMENTO
FOI CONDUZIDO EM

N (kg.ha-1)
0
0
0
0
50
50
50
50
100
100
100
100
150
150
150
150
200
200
200
200

10
CÁLCULO
x2
0
0
0
0
2500
2500
2500
2500
10000
10000
10000
10000
22500
22500
22500
22500
40000
40000
40000
40000
300000

y2
4178,3296
5634,0036
7768,6596
11174,6041
7899,6544
12067,0225
17072,0356
23314,2361
12796,1344
21453,4609
28920,4036
44698,4164
23568,3904
31538,2081
43010,6121
60836,2225
34536,5056
46673,2816
61936,2769
86218,5769
585295,035

xy
0
0
0
0
4444
5492,5
6533
7634,5
11312
14647
17006
21142
23028
26638,5
31108,5
36997,5
37168
43208
49774
58726
394859,5

x

xy

n
2
x)

b
x

(

2

y

n

(0

64 , 64

0



75 , 06

200

293 , 63 )

(0

0



2

(0

0

200 ) ( 64 , 64

 293 , 63 )

75 , 06

20

b
(0

2

0

2



20 )

 20 )

Material didático Estatística Aplicada à
Agricultura, 2013-2.

y
64,64
75,06
88,14
105,71
88,88
109,85
130,66
152,69
113,12
146,47
170,06
211,42
153,52
177,59
207,39
246,65
185,84
216,04
248,87
293,63
3186,2

5/1/2014

x
0
0
0
0
50
50
50
50
100
100
100
100
150
150
150
150
200
200
200
200
2000

2

20

394859 ,5

2000

3186 , 23

20
2
2000

b
300000

0,76

20

a

y

y

bx

x

b

n

n

x

xy

3186 , 23

0 , 762365

20

x

2

(

x)
n

83,08

20

y

394859 ,5

n

r

2000

2000

3186 , 23
20

2

y

2

(

y)
n

2

300000

2000
20

2

585295

0,86
( 3186 , 23 )
20

2

11
240

220

5/1/2014

180

160

140

120

100

80
0

20

40

60

80

100

120

140

160

180

200

Material didático Estatística Aplicada à
Agricultura, 2013-2.

Produtividade da cana (t/ha)

200

Nitrogênio (kg N/ha)

Figura 2 – Produtividade agrícola da cana de açúcar em Saturno, 2100, sob fertilização
nitrogenada. A linha representa a estimativa de regressão e os x, as médias reais.

12
INTERPRETAÇÃO DE REGRESSÃO LINEAR SIMPLES - SAS

DF
1
18
19

Pr > F
<,0001

77692

Root MSE
Dependent Mean
Coeff Var

32,97467
159,31150
20,69823

R-Square
Adj R-Sq

Parameter Estimates
Parameter Standard
Variable
DF Estimate
Error t Value
Intercept 1
83,07500 12,77103
6,50
N
1
0,76237
0,10428
7,31
Parameter Estimates
Variable
DF
Intercept
1
N
1

0,7481
0,7341

Standardized
Pr>|t| Estimate
<,0001
0
<,0001
0,86492

95% Confidence Limits
56,24405
109,90595
0,54329
0,98144

Material didático Estatística Aplicada à
Agricultura, 2013-2.

Source
Model
Error
Corrected
Total

Sum of
Mean
Squares
Square
F Value
58120
58120
53,45
19572
1087,32861

5/1/2014

Model: MODEL1 - Dependent Variable: _800125888
Analysis of Variance

13

Regressão linear simples

  • 1.
    REGRESSÃO LINEAR SIMPLES MarioAndrade Lira Junior www.lira.pro.brwordpress Direitos autorais reservados segundo licença Creative Commons 3.0: com Atribuição; Não Comercial; Compartilha Igual
  • 2.
    TERMOS IMPORTANTES 5/1/2014 Tipos de variáveis Qualitativa x Quantitativa  Dependente x Independente  Regressão  Correlação  Relação causa-efeito  Extrapolação x Interpolação  Valor ajustado - estimativa da população  Resíduo- diferença entre ajustado e real (variação do acaso)  Material didático Estatística Aplicada à Agricultura, 2013-2. 2
  • 3.
    REGRESSÃO X CORRELAÇÃO 5/1/2014 Diferença  Regressão -equação ligando duas ou mais variáveis  Correlação – medida do grau de ligação entre duas variáveis  Usos  Regressão – interpolares valores na faixa usada no experimento  Correlação – indicar variáveis com comportamento semelhante  Material didático Estatística Aplicada à Agricultura, 2013-2. 3
  • 4.
    COEFICIENTES Material didático EstatísticaAplicada à Agricultura, 2013-2.  Correlação (r)  Mede o grau de relação entre variáveis  Faixa de valores  0 a 1  Positivo ou negativo  Interpretação  Quanto mais próximo de 1/-1, maior a ligação entre as variáveis Determinação (r²)  Quanto a regressão explica dos dados  Faixa de valores  0 a 1  Interpretação  Quanto maior, mais a regressão explica 5/1/2014  4
  • 5.
    5/1/2014 - variável independente Médias Material didático Estatística Aplicada à Agricultura, 2013-2.  Acaso DE VARIAÇÃO CAUSAS 5
  • 6.
    REQUISITOS independente medida semerro Ou seja, só tem variação do acaso para Y Y pode ser explicado por reta em função de X  Para cada X os Y´s são   Independentes, ou seja, variação do acaso independente Resíduos com média zero  Homocedase Material didático Estatística Aplicada à Agricultura, 2013-2.  5/1/2014  Variável 6
  • 7.
    DE UMA REGRESSÃOLINEAR SIMPLES “LEITURA” 5/1/2014  Material didático Estatística Aplicada à Agricultura, 2013-2. 7
  • 8.
    90 80 70 5/1/2014 y = 1,14+7,88x R²= 0,94 Triângulo 60 Material didático Estatística Aplicada à Agricultura, 2013-2. y = 8,45+5,69x R² = 0,99 Quadrados 50 40 y = 2,32+1,99x R² = 0,98 Losangos 30 20 10 0 0 1 2 3 4 5 6 7 8 9 Figura 1 – Representação esquemática de três regressões lineares simples aleatórias, para interpretação dos coeficientes 10 8
  • 9.
    EQUAÇÕES PARA CÁLCULODA REGRESSÃO x )( 5/1/2014 ( y) N r x ( 2 x) 2 y N ( xy b x 2 x )( N 2 ( x) 2 ( y) N y) 2 Material didático Estatística Aplicada à Agricultura, 2013-2. xy N a y bx 9
  • 10.
    UM SATURNO EM 2100 ADUBAÇÃO NITROGENADA,COM OS TRATAMENTOS E RESULTADOS ABAIXO. CALCULE A REGRESSÃO ENTRE AS DUAS VARIÁVEIS Material didático Estatística Aplicada à Agricultura, 2013-2. AVALIANDO A RESPOSTA DE CANA DE AÇÚCAR À Produtividade (t.ha-1) 64,64 75,06 88,14 105,71 88,88 109,85 130,66 152,69 113,12 146,47 170,06 211,42 153,52 177,59 207,39 246,65 185,84 216,04 248,87 293,63 5/1/2014 EXPERIMENTO FOI CONDUZIDO EM N (kg.ha-1) 0 0 0 0 50 50 50 50 100 100 100 100 150 150 150 150 200 200 200 200 10
  • 11.
    CÁLCULO x2 0 0 0 0 2500 2500 2500 2500 10000 10000 10000 10000 22500 22500 22500 22500 40000 40000 40000 40000 300000 y2 4178,3296 5634,0036 7768,6596 11174,6041 7899,6544 12067,0225 17072,0356 23314,2361 12796,1344 21453,4609 28920,4036 44698,4164 23568,3904 31538,2081 43010,6121 60836,2225 34536,5056 46673,2816 61936,2769 86218,5769 585295,035 xy 0 0 0 0 4444 5492,5 6533 7634,5 11312 14647 17006 21142 23028 26638,5 31108,5 36997,5 37168 43208 49774 58726 394859,5 x xy n 2 x) b x ( 2 y n (0 64 , 64 0  75, 06 200 293 , 63 ) (0 0  2 (0 0 200 ) ( 64 , 64  293 , 63 ) 75 , 06 20 b (0 2 0 2  20 )  20 ) Material didático Estatística Aplicada à Agricultura, 2013-2. y 64,64 75,06 88,14 105,71 88,88 109,85 130,66 152,69 113,12 146,47 170,06 211,42 153,52 177,59 207,39 246,65 185,84 216,04 248,87 293,63 3186,2 5/1/2014 x 0 0 0 0 50 50 50 50 100 100 100 100 150 150 150 150 200 200 200 200 2000 2 20 394859 ,5 2000 3186 , 23 20 2 2000 b 300000 0,76 20 a y y bx x b n n x xy 3186 , 23 0 , 762365 20 x 2 ( x) n 83,08 20 y 394859 ,5 n r 2000 2000 3186 , 23 20 2 y 2 ( y) n 2 300000 2000 20 2 585295 0,86 ( 3186 , 23 ) 20 2 11
  • 12.
    240 220 5/1/2014 180 160 140 120 100 80 0 20 40 60 80 100 120 140 160 180 200 Material didático EstatísticaAplicada à Agricultura, 2013-2. Produtividade da cana (t/ha) 200 Nitrogênio (kg N/ha) Figura 2 – Produtividade agrícola da cana de açúcar em Saturno, 2100, sob fertilização nitrogenada. A linha representa a estimativa de regressão e os x, as médias reais. 12
  • 13.
    INTERPRETAÇÃO DE REGRESSÃOLINEAR SIMPLES - SAS DF 1 18 19 Pr > F <,0001 77692 Root MSE Dependent Mean Coeff Var 32,97467 159,31150 20,69823 R-Square Adj R-Sq Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Intercept 1 83,07500 12,77103 6,50 N 1 0,76237 0,10428 7,31 Parameter Estimates Variable DF Intercept 1 N 1 0,7481 0,7341 Standardized Pr>|t| Estimate <,0001 0 <,0001 0,86492 95% Confidence Limits 56,24405 109,90595 0,54329 0,98144 Material didático Estatística Aplicada à Agricultura, 2013-2. Source Model Error Corrected Total Sum of Mean Squares Square F Value 58120 58120 53,45 19572 1087,32861 5/1/2014 Model: MODEL1 - Dependent Variable: _800125888 Analysis of Variance 13