SlideShare uma empresa Scribd logo
1 de 33
Programa de Pós-Graduação em Ciências da Saúde
Disciplina de Bioestatística
Professor: Paulo N Rocha
paulonrocha@ufba.br
Créditos: Bioestatística: Princípios e Aplicações. Sidia M. Callegari-Jacques.
Introdução
 Termo regressão à média: Francis Galton 1886
 estatura dos filhos em relação à dos pais
 Estudo da regressão aplica-se àquelas situações em
que há razões para supor uma relação de causa x
efeito entre duas variáveis quantitativas e se deseja
expressar matematicamente essa relação
 Y = variável dependente (resposta)
 X = variável independente (explicativa ou preditiva)
EQUAÇÃO DA LINHA RETA
Diferentes notações
 Livro de Sidia M. Callegari-Jacques
 Y = A + Bx (população)
 Ŷ = a + bx (amostra, estimativa)
 Outros autores
 Y = α + βx (população)
 Ŷ = β0 + βx (amostra, estimativa)
 μY|X = β0 + βx (amostra, estimativa)
Reta que ilustra a equação
y = 10 – 2x
X y
0 10
1 8
2 6
3 4
4 2
5 0
1
B = -2
Gráfico de dispersão
Quantidade
de poluente
(ug/ml)
Escore de dano
ecológico
1 3
2 6
3 7
4 10
5 10
6 12
A regressão linear simples é um procedimento que fornece equações de linhas
retas que descrevem fenômenos em que há uma variável independente apenas
Two-way Scatter Plot
Stata Output
Os pontos experimentais
 É comum haver variação na variável dependente quando
ela é medida para um certo valor da variável
independente
 Pontos obtidos por um experimentador dificilmente se
colocam exatamente em uma linha
 Os desalinhamentos são interpretados como desvios, ao
acaso, do comportamento geral do fenômeno
 É por isso que se pensa em ajustar uma linha reta a
pontos que não estão perfeitamente alinhados
 A reta vai representar o comportamento médio dos
valores de y à medida que x aumenta de valor
Modelo proposto
 Linha reta: Y = A + Bx
 Regressão: Y = A + Bx + ε, onde:
 ε representa a diferença (desvio) entre o valor
observado de y e o esperado pela reta
 A linha reta representa o comportamento
de valores de y médios esperados para
distintos valores de x
Representação gráfica
Note que a variação é a mesma nas 4 subpopulações
Como traçar a reta da
regressão?
 Como obter a melhor reta?
 Mão livre: sujeito a erros de julgamento...
 Método analítico
 Como fazer previsões para y a partir de
valores conhecidos de x?
 Processo gráfico: sujeito a erros
 Equação da regressão
Obtenção da reta de regressão
 Reta de regressão verdadeira: seria obtida
se fossem conhecidos os valores de x e y
para todos os indivíduos da população
 Altura verdadeira da reta: parâmetro A
 Inclinação verdadeira da reta: coeficiente de
regressão B
 O mais comum é estudar a regressão
entre x e y utilizando uma amostra da
população de pontos
 a e b são as estimativas dos parâmetros A e B
Método dos mínimos
quadrados
 Assim chamado porque garante que a reta
obtida é aquela para a qual se tem as
menores distâncias (ao quadrado) entre os
valores observados (y) e a própria reta
b =
SPxy
SQx
=
(x - x)(y- y)å
(x - x)2
ou b =
xy -
x yåå
n
å
x2
å -
( xå )2
n
a = y - bx, onde y e x são as médias para y e x, respectivamente.
ˆy = a+ bx, onde ˆy é o valor esperado de y para cada valor de x.
Determinação das quantidades necessárias
para obtenção dos coeficientes da reta de
regressão
X(μg/ml) Y(dano) XY X2 Y2 Ŷ
1 3 3 1 9 3,72
2 6 12 4 36 5,43
3 7 21 9 49 7,14
4 10 40 16 100 8,86
5 10 50 25 100 10,57
6 12 72 36 144 12,28
Σ 21 48 198 91 438 48,00
b =
xy -
x yåå
n
å
x2
å -
( xå )2
n
=
198-
(21´ 48)
6
91-
(21)2
6
=
30
17,5
=1,71
a = y - bx = (48 / 6)-1,71(21/ 6) = 8-1,71(3,5) = 2,02
ˆy = 2,02+1,71x
Two-way Scatter Plot
Teste de significância da
regressão
Etapas do teste de hipóteses
da regressão
 Elaboração das hipóteses estatísticas
 H0 : B = 0
 HA : B ≠ 0
 Nível de significância
 α = 0,01
 Determinação do valor crítico do teste
 gl = n – 2
 t0,01;4 = 4,604
 Determinação do valor calculado do
teste
Determinação do valor calculado do teste, decisão e conclusão
unidades.1,71aumenteecológico
danooquese-esperapoluente,doconc.nag/L1deacréscimocadaPara
0,01).(xsobreyderegressãoexistequeadmitimosLogo,
zero.serdevenão(B)alpopulacionregressãodeecoeficiento:Conclusão
.0,604,4144,9Como
padrão)-erros9aprox.deézeroebentredistância(a144,9
187,0
71,1
187,00351,0
70
46,2
6
)21(
91)26(
)19871,1()4802,2(438
)(
)2(
abaixoaalternativfórmulaa,
)()2(
)ˆ(
4;01,0
2
2
2
2
2
2

 





























 
  


Hrejeita-sett
t
EP
n
x
xn
xybyay
EP
ou
xxn
yy
EP
EP
b
EP
Bb
t
calc
calc
b
b
b
bb
calc
Stata Output
y = 8
Desvio explicado
(ŷi – y)
Desvio não-explicado
(yi – ŷi)
Desvio total
(yi – y)
Desvio total = (yi – y)
Desvio explicado = (ŷi – y)
Desvio não explicado = (yi – ŷi)
Créditos: Neto, AS
 (yi – y)2 =  (ŷi – y)2 +  (yi – ŷi)2
Soma total
dos
quadrados
SST = SSR + SSE
Se medirmos estes desvios para
cada yi e ŷi , elevarmos ao
quadrado cada desvio, e
somarmos os desvios
quadrados, teremos
Soma dos
quadrados
explicada
Soma dos
quadrados não
explicada
Créditos: Neto, AS
SSR
k MSR
F = =
SSE MSE
n – k – 1
Teste estatístico
Créditos: Neto, AS
Fonte de
variação
SS GL MS F
Regressão
linear
SSR k MSR=SSR/k MSR/MSE
Residual SSE n-k-1 MSE=SSE/n-k-1
Total SST n-1
Tabela de análise de
variância
Créditos: Neto, AS
COEFICIENTE DE
DETERMINAÇÃO
SSR
SST
 (ŷi – y) 2
 (yi – y) 2
r 2 = =
Créditos: Neto, AS
Stata Output
Utilidades da reta de regressão
 Representar a dependência de uma
variável quantitativa em relação à outra por
meio de uma equação simples
 Prever valores para a variável dependente
y de acordo com valores determinados
(inclusive não-observados) da variável
independente x.
Pressupostos da regressão
linear
1. A variável y deve ter distribuição normal (ou
aproximadamente normal)
2. Homocedasticidade (a variação de y deve ser a
mesma para cada valor de x)
3. Os pontos no gráfico devem representar uma
tendência linear
4. Amostragem independente e aleatória
5. Variável x medida sem erro
Análise de resíduos
 Os resíduos representam a diferença entre aquilo que foi
observado e o que foi predito pelo modelo de regressão.
 Resíduo = E = (y - ˆy)
 Calculam-se os resíduos para cada valor de y
 Desenha-se um gráfico no qual os resíduos são
colocados no eixo vertical e os valores esperados de y
(ˆy), no horizontal.
 Os pontos devem se distribuir de forma equilibrada acima
e abaixo da linha imaginária paralela ao eixo x na altura
do resíduo zero, formando uma faixa aproximadamente
retangular
Residual versus Predicted (RVP)
Plot
Gráficos de resíduos
Faixas em forma de curva
Violação ao pressuposto #2
Não existe homocedasticidade
Faixas curvas
Violação ao pressuposto #3
A reta não é o modelo adequado
Fim

Mais conteúdo relacionado

Mais procurados

Introdução ao modelo clássico de regressão linear
Introdução ao modelo clássico de regressão linearIntrodução ao modelo clássico de regressão linear
Introdução ao modelo clássico de regressão linearFelipe Pontes
 
Probabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasLucas Vinícius
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parteRobson Odé
 
Introdução à Regressão Linear Simples e Múltipla
Introdução à Regressão Linear Simples e MúltiplaIntrodução à Regressão Linear Simples e Múltipla
Introdução à Regressão Linear Simples e MúltiplaCélia M. D. Sales
 
Funcoes trigonometricas.ppt
Funcoes trigonometricas.pptFuncoes trigonometricas.ppt
Funcoes trigonometricas.pptRodrigo Carvalho
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Rodrigo Rodrigues
 
Econometria modelos de_regressao_linear
Econometria modelos de_regressao_linearEconometria modelos de_regressao_linear
Econometria modelos de_regressao_linearJoevan Santos
 

Mais procurados (20)

Regressão linear simples
Regressão linear simplesRegressão linear simples
Regressão linear simples
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Qui quadrado
Qui quadradoQui quadrado
Qui quadrado
 
Correlação Estatística
Correlação EstatísticaCorrelação Estatística
Correlação Estatística
 
Aula 30 testes de hipóteses
Aula 30   testes de hipótesesAula 30   testes de hipóteses
Aula 30 testes de hipóteses
 
Tópico 4 regressão linear simples 01
Tópico 4   regressão linear simples 01Tópico 4   regressão linear simples 01
Tópico 4 regressão linear simples 01
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Conceitos Básicos de Estatística I
Conceitos Básicos de Estatística IConceitos Básicos de Estatística I
Conceitos Básicos de Estatística I
 
Introdução ao modelo clássico de regressão linear
Introdução ao modelo clássico de regressão linearIntrodução ao modelo clássico de regressão linear
Introdução ao modelo clássico de regressão linear
 
Conceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística II
 
Probabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis AleatóriasProbabilidade e estatística - Variáveis Aleatórias
Probabilidade e estatística - Variáveis Aleatórias
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
 
Introdução à Regressão Linear Simples e Múltipla
Introdução à Regressão Linear Simples e MúltiplaIntrodução à Regressão Linear Simples e Múltipla
Introdução à Regressão Linear Simples e Múltipla
 
Funcoes trigonometricas.ppt
Funcoes trigonometricas.pptFuncoes trigonometricas.ppt
Funcoes trigonometricas.ppt
 
Amostragem - estatistica
Amostragem - estatisticaAmostragem - estatistica
Amostragem - estatistica
 
Estatistica descritiva
Estatistica descritiva Estatistica descritiva
Estatistica descritiva
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
 
Aula 01 introdução a estatística
Aula 01   introdução a estatísticaAula 01   introdução a estatística
Aula 01 introdução a estatística
 
Aula 12 intervalo de confiança
Aula 12   intervalo de confiançaAula 12   intervalo de confiança
Aula 12 intervalo de confiança
 
Econometria modelos de_regressao_linear
Econometria modelos de_regressao_linearEconometria modelos de_regressao_linear
Econometria modelos de_regressao_linear
 

Semelhante a Regressão Linear Simples

Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linearcoelhojmm
 
AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxNunoSilva599593
 
Capitulo 8 gujarati resumo
Capitulo 8 gujarati resumoCapitulo 8 gujarati resumo
Capitulo 8 gujarati resumoMonica Barros
 
AULA-11-REGRESSAO-LINEAR-pptx.pptx
AULA-11-REGRESSAO-LINEAR-pptx.pptxAULA-11-REGRESSAO-LINEAR-pptx.pptx
AULA-11-REGRESSAO-LINEAR-pptx.pptxMarcos Boaventura
 
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Jean Paulo Mendes Alves
 
Formulario inferencia estatistica - 1 e 2 populacoes
Formulario   inferencia estatistica - 1 e 2 populacoesFormulario   inferencia estatistica - 1 e 2 populacoes
Formulario inferencia estatistica - 1 e 2 populacoesPedro Casquilho
 
As equações do segundo grau são abordadas na história da matemática desde a é...
As equações do segundo grau são abordadas na história da matemática desde a é...As equações do segundo grau são abordadas na história da matemática desde a é...
As equações do segundo grau são abordadas na história da matemática desde a é...leosilveira
 
5.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_201510061453325.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_20151006145332Samuel Ferreira da Silva
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
 
Relatório de matemática – aula II
Relatório de matemática – aula IIRelatório de matemática – aula II
Relatório de matemática – aula IInicole_gonzalez
 
Relatório de matemática – aula II
Relatório de matemática – aula IIRelatório de matemática – aula II
Relatório de matemática – aula IInicole_gonzalez
 
Formulario estatistica descritiva univariada e bivariava 2013
Formulario estatistica descritiva univariada e bivariava  2013Formulario estatistica descritiva univariada e bivariava  2013
Formulario estatistica descritiva univariada e bivariava 2013Pedro Casquilho
 
Lista de Exercícios Econometria I - UFES
Lista de Exercícios Econometria I - UFESLista de Exercícios Econometria I - UFES
Lista de Exercícios Econometria I - UFESRamon Cristian
 

Semelhante a Regressão Linear Simples (20)

Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
 
Regressao
RegressaoRegressao
Regressao
 
AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptx
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
 
Capitulo 8 gujarati resumo
Capitulo 8 gujarati resumoCapitulo 8 gujarati resumo
Capitulo 8 gujarati resumo
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
 
AULA-11-REGRESSAO-LINEAR-pptx.pptx
AULA-11-REGRESSAO-LINEAR-pptx.pptxAULA-11-REGRESSAO-LINEAR-pptx.pptx
AULA-11-REGRESSAO-LINEAR-pptx.pptx
 
Regressao simples
Regressao simplesRegressao simples
Regressao simples
 
Exercicio de Regressao Linear Simples
Exercicio de Regressao Linear SimplesExercicio de Regressao Linear Simples
Exercicio de Regressao Linear Simples
 
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
 
Formulario inferencia estatistica - 1 e 2 populacoes
Formulario   inferencia estatistica - 1 e 2 populacoesFormulario   inferencia estatistica - 1 e 2 populacoes
Formulario inferencia estatistica - 1 e 2 populacoes
 
As equações do segundo grau são abordadas na história da matemática desde a é...
As equações do segundo grau são abordadas na história da matemática desde a é...As equações do segundo grau são abordadas na história da matemática desde a é...
As equações do segundo grau são abordadas na história da matemática desde a é...
 
5.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_201510061453325.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_20151006145332
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Relatório de matemática – aula II
Relatório de matemática – aula IIRelatório de matemática – aula II
Relatório de matemática – aula II
 
Relatório de matemática – aula II
Relatório de matemática – aula IIRelatório de matemática – aula II
Relatório de matemática – aula II
 
Formulario estatistica descritiva univariada e bivariava 2013
Formulario estatistica descritiva univariada e bivariava  2013Formulario estatistica descritiva univariada e bivariava  2013
Formulario estatistica descritiva univariada e bivariava 2013
 
Lista de Exercícios Econometria I - UFES
Lista de Exercícios Econometria I - UFESLista de Exercícios Econometria I - UFES
Lista de Exercícios Econometria I - UFES
 
Correlação
CorrelaçãoCorrelação
Correlação
 
Princípios de Estatística Inferencial - I
Princípios de Estatística Inferencial - IPrincípios de Estatística Inferencial - I
Princípios de Estatística Inferencial - I
 

Mais de Federal University of Bahia

Avaliação hemodinâmica no paciente criticamente enfermo
Avaliação hemodinâmica no paciente criticamente enfermoAvaliação hemodinâmica no paciente criticamente enfermo
Avaliação hemodinâmica no paciente criticamente enfermoFederal University of Bahia
 
Suporte Nutricional No Paciente com Lesão Renal Aguda
Suporte Nutricional No Paciente com Lesão Renal AgudaSuporte Nutricional No Paciente com Lesão Renal Aguda
Suporte Nutricional No Paciente com Lesão Renal AgudaFederal University of Bahia
 
O Que Mudou no Tratamento da Lesão Renal Aguda nos úLtimos 10 Anos
O Que Mudou no Tratamento da Lesão Renal Aguda nos úLtimos 10 AnosO Que Mudou no Tratamento da Lesão Renal Aguda nos úLtimos 10 Anos
O Que Mudou no Tratamento da Lesão Renal Aguda nos úLtimos 10 AnosFederal University of Bahia
 

Mais de Federal University of Bahia (20)

Análise de Sobrevivência
Análise de SobrevivênciaAnálise de Sobrevivência
Análise de Sobrevivência
 
Regressão Logística
Regressão LogísticaRegressão Logística
Regressão Logística
 
Hiponatremia
HiponatremiaHiponatremia
Hiponatremia
 
Acute Kidney Injury in Nephrotic Syndrome
Acute Kidney Injury in Nephrotic SyndromeAcute Kidney Injury in Nephrotic Syndrome
Acute Kidney Injury in Nephrotic Syndrome
 
Hiponatremia revisão geral em 20 min
Hiponatremia   revisão geral em 20 minHiponatremia   revisão geral em 20 min
Hiponatremia revisão geral em 20 min
 
Distúrbio
DistúrbioDistúrbio
Distúrbio
 
Avaliação hemodinâmica no paciente criticamente enfermo
Avaliação hemodinâmica no paciente criticamente enfermoAvaliação hemodinâmica no paciente criticamente enfermo
Avaliação hemodinâmica no paciente criticamente enfermo
 
Suporte Nutricional No Paciente com Lesão Renal Aguda
Suporte Nutricional No Paciente com Lesão Renal AgudaSuporte Nutricional No Paciente com Lesão Renal Aguda
Suporte Nutricional No Paciente com Lesão Renal Aguda
 
O Que Mudou no Tratamento da Lesão Renal Aguda nos úLtimos 10 Anos
O Que Mudou no Tratamento da Lesão Renal Aguda nos úLtimos 10 AnosO Que Mudou no Tratamento da Lesão Renal Aguda nos úLtimos 10 Anos
O Que Mudou no Tratamento da Lesão Renal Aguda nos úLtimos 10 Anos
 
Estratificação da Lesão Renal Aguda
Estratificação da Lesão Renal AgudaEstratificação da Lesão Renal Aguda
Estratificação da Lesão Renal Aguda
 
Amostragem
AmostragemAmostragem
Amostragem
 
Amostragem
AmostragemAmostragem
Amostragem
 
Princípios de Estatística Inferencial - II
Princípios de Estatística Inferencial - IIPrincípios de Estatística Inferencial - II
Princípios de Estatística Inferencial - II
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Uso de Bicarbonato na Acidose Metabólica
Uso de Bicarbonato na Acidose MetabólicaUso de Bicarbonato na Acidose Metabólica
Uso de Bicarbonato na Acidose Metabólica
 
Discurso Paraninfia FMB-UFBA 2008.1
Discurso Paraninfia FMB-UFBA 2008.1Discurso Paraninfia FMB-UFBA 2008.1
Discurso Paraninfia FMB-UFBA 2008.1
 
Ira No Ofidismo
Ira No OfidismoIra No Ofidismo
Ira No Ofidismo
 
Hiponatremia
HiponatremiaHiponatremia
Hiponatremia
 
SIHAD
SIHADSIHAD
SIHAD
 
Hiponatremia
HiponatremiaHiponatremia
Hiponatremia
 

Regressão Linear Simples

  • 1. Programa de Pós-Graduação em Ciências da Saúde Disciplina de Bioestatística Professor: Paulo N Rocha paulonrocha@ufba.br Créditos: Bioestatística: Princípios e Aplicações. Sidia M. Callegari-Jacques.
  • 2. Introdução  Termo regressão à média: Francis Galton 1886  estatura dos filhos em relação à dos pais  Estudo da regressão aplica-se àquelas situações em que há razões para supor uma relação de causa x efeito entre duas variáveis quantitativas e se deseja expressar matematicamente essa relação  Y = variável dependente (resposta)  X = variável independente (explicativa ou preditiva)
  • 4. Diferentes notações  Livro de Sidia M. Callegari-Jacques  Y = A + Bx (população)  Ŷ = a + bx (amostra, estimativa)  Outros autores  Y = α + βx (população)  Ŷ = β0 + βx (amostra, estimativa)  μY|X = β0 + βx (amostra, estimativa)
  • 5. Reta que ilustra a equação y = 10 – 2x X y 0 10 1 8 2 6 3 4 4 2 5 0 1 B = -2
  • 6. Gráfico de dispersão Quantidade de poluente (ug/ml) Escore de dano ecológico 1 3 2 6 3 7 4 10 5 10 6 12 A regressão linear simples é um procedimento que fornece equações de linhas retas que descrevem fenômenos em que há uma variável independente apenas
  • 9. Os pontos experimentais  É comum haver variação na variável dependente quando ela é medida para um certo valor da variável independente  Pontos obtidos por um experimentador dificilmente se colocam exatamente em uma linha  Os desalinhamentos são interpretados como desvios, ao acaso, do comportamento geral do fenômeno  É por isso que se pensa em ajustar uma linha reta a pontos que não estão perfeitamente alinhados  A reta vai representar o comportamento médio dos valores de y à medida que x aumenta de valor
  • 10. Modelo proposto  Linha reta: Y = A + Bx  Regressão: Y = A + Bx + ε, onde:  ε representa a diferença (desvio) entre o valor observado de y e o esperado pela reta  A linha reta representa o comportamento de valores de y médios esperados para distintos valores de x
  • 11. Representação gráfica Note que a variação é a mesma nas 4 subpopulações
  • 12. Como traçar a reta da regressão?  Como obter a melhor reta?  Mão livre: sujeito a erros de julgamento...  Método analítico  Como fazer previsões para y a partir de valores conhecidos de x?  Processo gráfico: sujeito a erros  Equação da regressão
  • 13. Obtenção da reta de regressão  Reta de regressão verdadeira: seria obtida se fossem conhecidos os valores de x e y para todos os indivíduos da população  Altura verdadeira da reta: parâmetro A  Inclinação verdadeira da reta: coeficiente de regressão B  O mais comum é estudar a regressão entre x e y utilizando uma amostra da população de pontos  a e b são as estimativas dos parâmetros A e B
  • 14. Método dos mínimos quadrados  Assim chamado porque garante que a reta obtida é aquela para a qual se tem as menores distâncias (ao quadrado) entre os valores observados (y) e a própria reta b = SPxy SQx = (x - x)(y- y)å (x - x)2 ou b = xy - x yåå n å x2 å - ( xå )2 n a = y - bx, onde y e x são as médias para y e x, respectivamente. ˆy = a+ bx, onde ˆy é o valor esperado de y para cada valor de x.
  • 15. Determinação das quantidades necessárias para obtenção dos coeficientes da reta de regressão X(μg/ml) Y(dano) XY X2 Y2 Ŷ 1 3 3 1 9 3,72 2 6 12 4 36 5,43 3 7 21 9 49 7,14 4 10 40 16 100 8,86 5 10 50 25 100 10,57 6 12 72 36 144 12,28 Σ 21 48 198 91 438 48,00 b = xy - x yåå n å x2 å - ( xå )2 n = 198- (21´ 48) 6 91- (21)2 6 = 30 17,5 =1,71 a = y - bx = (48 / 6)-1,71(21/ 6) = 8-1,71(3,5) = 2,02 ˆy = 2,02+1,71x
  • 17. Teste de significância da regressão
  • 18. Etapas do teste de hipóteses da regressão  Elaboração das hipóteses estatísticas  H0 : B = 0  HA : B ≠ 0  Nível de significância  α = 0,01  Determinação do valor crítico do teste  gl = n – 2  t0,01;4 = 4,604  Determinação do valor calculado do teste
  • 19. Determinação do valor calculado do teste, decisão e conclusão unidades.1,71aumenteecológico danooquese-esperapoluente,doconc.nag/L1deacréscimocadaPara 0,01).(xsobreyderegressãoexistequeadmitimosLogo, zero.serdevenão(B)alpopulacionregressãodeecoeficiento:Conclusão .0,604,4144,9Como padrão)-erros9aprox.deézeroebentredistância(a144,9 187,0 71,1 187,00351,0 70 46,2 6 )21( 91)26( )19871,1()4802,2(438 )( )2( abaixoaalternativfórmulaa, )()2( )ˆ( 4;01,0 2 2 2 2 2 2                                        Hrejeita-sett t EP n x xn xybyay EP ou xxn yy EP EP b EP Bb t calc calc b b b bb calc
  • 21. y = 8 Desvio explicado (ŷi – y) Desvio não-explicado (yi – ŷi) Desvio total (yi – y)
  • 22. Desvio total = (yi – y) Desvio explicado = (ŷi – y) Desvio não explicado = (yi – ŷi) Créditos: Neto, AS
  • 23.  (yi – y)2 =  (ŷi – y)2 +  (yi – ŷi)2 Soma total dos quadrados SST = SSR + SSE Se medirmos estes desvios para cada yi e ŷi , elevarmos ao quadrado cada desvio, e somarmos os desvios quadrados, teremos Soma dos quadrados explicada Soma dos quadrados não explicada Créditos: Neto, AS
  • 24. SSR k MSR F = = SSE MSE n – k – 1 Teste estatístico Créditos: Neto, AS
  • 25. Fonte de variação SS GL MS F Regressão linear SSR k MSR=SSR/k MSR/MSE Residual SSE n-k-1 MSE=SSE/n-k-1 Total SST n-1 Tabela de análise de variância Créditos: Neto, AS
  • 26. COEFICIENTE DE DETERMINAÇÃO SSR SST  (ŷi – y) 2  (yi – y) 2 r 2 = = Créditos: Neto, AS
  • 28. Utilidades da reta de regressão  Representar a dependência de uma variável quantitativa em relação à outra por meio de uma equação simples  Prever valores para a variável dependente y de acordo com valores determinados (inclusive não-observados) da variável independente x.
  • 29. Pressupostos da regressão linear 1. A variável y deve ter distribuição normal (ou aproximadamente normal) 2. Homocedasticidade (a variação de y deve ser a mesma para cada valor de x) 3. Os pontos no gráfico devem representar uma tendência linear 4. Amostragem independente e aleatória 5. Variável x medida sem erro
  • 30. Análise de resíduos  Os resíduos representam a diferença entre aquilo que foi observado e o que foi predito pelo modelo de regressão.  Resíduo = E = (y - ˆy)  Calculam-se os resíduos para cada valor de y  Desenha-se um gráfico no qual os resíduos são colocados no eixo vertical e os valores esperados de y (ˆy), no horizontal.  Os pontos devem se distribuir de forma equilibrada acima e abaixo da linha imaginária paralela ao eixo x na altura do resíduo zero, formando uma faixa aproximadamente retangular
  • 32. Gráficos de resíduos Faixas em forma de curva Violação ao pressuposto #2 Não existe homocedasticidade Faixas curvas Violação ao pressuposto #3 A reta não é o modelo adequado
  • 33. Fim