SlideShare uma empresa Scribd logo
Prof.SauloJardim–saulojardim@id.uff.br
Cap 2. Análise de regressão com
duas variáveis: algumas
ideias básicas
Prof. MSc. Saulo Jardim
Modelagem Estatística
Prof.SauloJardim–saulojardim@id.uff.br
 Trataremos agora o conceito de regressão de maneira mais formal.
 Regressão simples (com apenas duas variáveis).
 A análise de regressão trata, em grande parte, da estimação e/ou
previsão do valor médio (para a população) da variável dependente
com base nos valores conhecidos, ou fixados, da variável
explanatória.
 Dados do Exemplo 1: Eles se referem auma população total de 60
famílias de uma comunidade hipotética e sua renda (X) e despesas de
consumo(Y) semanais, ambas medidas em dólares. As 60 famílias foram
divididas em dez grupos de renda(de $ 80 a $ 260) e as despesas
semanais de cada família nos vários grupos são apresentadas na
tabela.
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 É importante distinguir esses valores esperados condicionais dos
valores esperados incondicionais das despesas semanais de consumo,
E(Y).
 Se somarmos as despesas de consumo semanais das 60 famílias da
população e dividirmos esse total por 60, obteremos o número $
121,20 ($ 7.272/60), que é a média incondicional, ou esperada, das
despesas de consumo semanais, E(Y);
 Perguntas importantes:“Qual o valor esperado das despesas de consumo
semanais médias de uma família?” Mas se perguntarmos: “Qual o valor
esperado das despesas de consumo semanais de uma família cuja renda
mensal é de $ 140?”.
 Respostas: 121,20 e 101, respectivamente.
Prof.SauloJardim–saulojardim@id.uff.br
 Se unirmos os valores médios condicionais obteremos o que é
conhecido como linha de regressão populacional (LRP) ou, de modo
mais geral, a curva de regressão populacional.
Prof.SauloJardim–saulojardim@id.uff.br
 Conhecer a classe de renda pode nos permitir prever melhor o valor
médio das despesas de consumo do que se não tivermos esse dado.
Esta, é a essência da análise de regressão.
 Em termos geométricos, uma curva de regressão populacional é apenas
o local geométrico das médias condicionais da variável dependente
para os valores fixados da(s) variável(is) explanatória(s).
 Na figura abaixo, para cada X (isto é, nível de renda), há uma
população de valores de Y (despesas de consumo semanais) que se
espalham em torno da média (condicional) desses valores de Y. Para
simplificarmos, pressupomos que esses valores de Y distribuem-se
simetricamente em torno de seus respectivos valores médios
(condicionais) e que a linha (ou curva) passa por esses valores
médios (condicionais).
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 Relembrando a definição de Regressão:
A análise de regressão diz respeito ao estudo da dependência
de uma variável, a variável dependente, em relação a uma ou
mais variáveis, as variáveis explanatórias, visando estimar
e/ou prever o valor médio (da população) da primeira em
termos dos valores conhecidos ou fixados (em amostragens
repetidas) das segundas.
Prof.SauloJardim–saulojardim@id.uff.br
 Cada média condicional 𝐸(𝑌|𝑋𝑖) é uma função de 𝑋𝑖, em que 𝑋𝑖 é um dado
valor de X. Simbolicamente,
 Conhecida também como a função de esperança condicional (FEC) ou
função de regressão populacional (FRP).
 Qual é a forma assumida pela função f(𝑋𝑖)? Supondo que FRP 𝐸(𝑌|𝑋𝑖) é
uma função linear de 𝑋𝑖 do tipo:
CONCEITO DE FUNÇÃO DE REGRESSÃO POPULACIONAL (FRP)
Prof.SauloJardim–saulojardim@id.uff.br
 𝛽1 e 𝛽2 são parâmetros desconhecidos, mas fixos, chamados de
coeficientes de regressão;
 𝛽1 e 𝛽2 também são conhecidos como intercepto e coeficiente angular,
respectivamente.
 Nosso interese na Análise de Regreessão, é estimar os valores de
incógnitas como 𝛽1 e 𝛽2com base nas observações de Y e X.
Prof.SauloJardim–saulojardim@id.uff.br
 Em termos geométricos, a curva de regressão nesse caso é uma reta.
 Sob essa interpretação, uma função de regressão como
𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐 𝑿 𝟐
não é uma função linear, porque a variável X aparece com um expoente
ou índice de 2.
O SIGNIFICADO DO TERMO LINEAR
LINEARIDADE NOS PARÂMETROS
 Um modelo não linear nos parâmetros: 𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐
𝟐
X
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 Tabela 2.1 e a Figura
2.1 mostram que as
despesas de consumo de
uma família não
aumentam
necessariamente quando
aumenta seu nível de
renda. CERTO ?
ESPECIFICAÇÃO ESTOCÁSTICA DA FRP
Prof.SauloJardim–saulojardim@id.uff.br
 O que podemos dizer sobre a relação entre as despesas de consumo de
uma família e um nível de renda? Vemos na Figura 2.1 que para um
nível de renda 𝑋𝑖 as despesas médias de consumo de uma família
agrupam-se em torno do consumo médio de todas as famílias deste
nível 𝑋𝑖 , isto é, em torno de sua esperança condicional. Portanto,
podemos expressar o desvio individual de 𝑌𝑖 em torno de seu valor
esperado como a seguir:
 em que o desvio 𝑢𝑖 é uma variável aleatória não-observável que assume
valores positivos ou negativos. Tecnicamente, 𝑢𝑖 é conhecida como
distúrbio estocástico ou termo de erro estocástico.
Prof.SauloJardim–saulojardim@id.uff.br
 Podemos dizer que a despesa de consumo de uma família individual,
dado seu nível de renda, pode ser expressa como a soma de dois
componentes: (1) 𝐸(𝑌|𝑋𝑖) , que é simplesmente o gasto médio em consumo
de todas as famílias com o mesmo nível de renda (esse componente é
conhecido como sistemático ou determinístico); e (2) 𝑢𝑖 , que é o
componente aleatório ou não-sistemático.
 Podemos escrever a equação da seguinte maneira:
Prof.SauloJardim–saulojardim@id.uff.br
 Se tomarmos o valor esperado nos dois lados da equação, obtemos:
 em que levamos em consideração o fato de que o valor esperado de uma
constante é a própria constante. Observe que 𝐸 𝑌 𝑋𝑖 , uma vez que o
valor de 𝑋𝑖 é fixo, é uma constante.
 Observe atentamente que, na Equação, tomamos a esperança condicional
condicionada a um dado X. Como 𝐸 𝑌𝑖 𝑋𝑖 é o mesmo que 𝐸 𝑌 𝑋𝑖 , a
Equação implica que
Prof.SauloJardim–saulojardim@id.uff.br
 Assim, a suposição de que a linha de regressão passa pelas médias
condicionais de Y implica que os valores médios condicionais de 𝑢𝑖
(condicionados a um dado X) sejam iguais a zero.
 O termo de erro ui representa todas as variáveis omitidas no modelo,
mas que coletivamente afetam Y.
 A pergunta óbvia é: por que não introduzir essas variáveis
explicitamente no modelo? Ou seja, por que não formular um modelo de
regressão com o máximo de variáveis possíveis? Há muitas razões:
O SIGNIFICADO DO TERMO “ERRO ESTOCÁSTICO”
Prof.SauloJardim–saulojardim@id.uff.br
 1- Caráter vago da teoria.
 2- Indisponibilidade de dados.
 3- Variáveis essenciais versus variáveis periféricas/secundárias.
 4- Caráter intrinsecamente aleatório do comportamento humano (mesmo se
conseguirmos incluir todas as variáveis relevantes no modelo, sempre haverá uma aleatoriedade
“intrínseca” nos Y individuais que não pode ser explicada por mais que nos esforcemos para tanto. Os
termos de erro, os u, podem refletir bem a aleatoriedade intrínseca.)
 5- Variáveis proxy pouco adequadas.
 6- Princípio da parcimônia (de acordo com a navalha de Occam,12 o ideal seria formular
o modelo de regressão mais simples possível.).
 7-Forma funcional errada (função linear ou não linear?).
Prof.SauloJardim–saulojardim@id.uff.br
 Nossa tarefa agora é estimar a função de regressão com base em
informações amostrais.
 A pergunta é: com base na amostra da Tabela 2.4, é possível prever
as despesas médias de consumo semanais Y para a população como um
todo correspondentes aos X escolhidos? Em outras palavras, podemos
estimar a FRP com base nos dados da amostra?
 Não seremos capazes de estimar “precisamente” a FRP devido a
variações amostrais.
A FUNÇÃO DE REGRESSÃO AMOSTRAL (FRA)
Prof.SauloJardim–saulojardim@id.uff.br
 Exemplo:
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 Qual das duas linhas de regressão representa a linha de regressão
populacional “real”?
 Não há como ter certeza absoluta de qual das linhas de regressão
representa a verdadeira linha (ou curva) de regressão populacional.
Devido às variações amostrais, elas são, no máximo, aproximações da
verdadeira regressão populacional.
 Agora, tal como no caso da FRP subjacente à linha de regressão
populacional, podemos formular o conceito de função de regressão
amostral (FRA) para representar a linha de regressão da amostra.
Prof.SauloJardim–saulojardim@id.uff.br
 Observe que um estimador, também conhecido como estatística
(amostral), é apenas uma regra ou fórmula ou método que nos diz como
estimar o parâmetro da população com base nas informações oferecidas
pela amostra que temos à mão. Um valor numérico em particular obtido
pela aplicação do estimador é conhecido como estimativa.
 Podemos expressar a FRA na Equação em sua forma estocástica como a
seguir:
Prof.SauloJardim–saulojardim@id.uff.br
 Resumindo, então, verificamos que nosso objetivo primordial na
análise de regressão é estimar a FRP:
 com base na FRA
 Obviamente, 𝑌𝑖 superestima a verdadeira 𝐸 𝑌 𝑋𝑖 para o 𝑋𝑖 nela
mostrado. Da mesma forma, para cada 𝑋𝑖 à esquerda do ponto A, a FRA
subestimará a verdadeira FRP. Contudo, pode ver facilmente que essas
sobre e subestimações são inevitáveis devido às variações amostrais.
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 A pergunta crítica agora é: sabendo que a FRA não é mais do que uma
aproximação da FRP, podemos formular uma regra ou um método que
torne essa aproximação a mais próxima possível? Em outras palavras,
como devemos formular a FRA para que 𝛽1fique o mais próximo possível
do verdadeiro 𝜷 𝟏 e 𝛽2 do verdadeiro 𝜷 𝟐 , mesmo que nunca venhamos a
saber quais são os verdadeiros 𝜷 𝟏 e 𝜷 𝟐?
 A resposta para essa pergunta ocupará grande parte de nossa atenção
no Capítulo 3. Aqui destacamos que é possível desenvolver
procedimentos que nos digam como formular a FRA a fim de espelhar
FRP o mais fielmente possível. É fascinante considerar que isso pode
ser feito mesmo que nunca determinemos a FRP real.
Prof.SauloJardim–saulojardim@id.uff.br
Aplicação no R
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
Anos de Estudo Salário Médio ($/hora) Número de pessoas
6 4,45 3
7 5,77 5
8 5,97 15
9 7,33 12
10 7,31 17
11 5,58 27
12 7,81 218
13 7,83 37
14 11,02 56
15 10,67 13
16 10,83 70
17 13,61 24
18 13,53 31
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br

Mais conteúdo relacionado

Mais procurados

A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
Daniel Brandão de Castro
 
05 tópico 4 - multicolinearidade
05   tópico 4 - multicolinearidade05   tópico 4 - multicolinearidade
05 tópico 4 - multicolinearidade
Ricardo Bruno - Universidade Federal do Pará
 
econometria
 econometria econometria
econometria
Robertta Karoline
 
Introdução à Regressão Linear
Introdução à Regressão LinearIntrodução à Regressão Linear
Introdução à Regressão Linear
Fernando A. B. Sabino da Silva
 
Regressão - aula 04/04
Regressão - aula 04/04Regressão - aula 04/04
Regressão - aula 04/04
Rodrigo de Sá
 
Análise de Componentes Principais
Análise de Componentes PrincipaisAnálise de Componentes Principais
Análise de Componentes Principais
Célia M. D. Sales
 
03 tópico 2 - regressão multipla
03   tópico 2 - regressão multipla03   tópico 2 - regressão multipla
03 tópico 2 - regressão multipla
Ricardo Bruno - Universidade Federal do Pará
 
Prática de Regressão no SPSS
Prática de Regressão no SPSSPrática de Regressão no SPSS
Prática de Regressão no SPSS
Vitor Vieira Vasconcelos
 
Correlação
CorrelaçãoCorrelação
Regressão - aula 03/04
Regressão - aula 03/04Regressão - aula 03/04
Regressão - aula 03/04
Rodrigo de Sá
 
02 tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
02   tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA02   tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
02 tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
Ricardo Bruno - Universidade Federal do Pará
 
Vetores Autoregressivos
Vetores AutoregressivosVetores Autoregressivos
Vetores Autoregressivos
Fernando A. B. Sabino da Silva
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
Rodrigo Rodrigues
 
Regressao linear multipla
Regressao linear multiplaRegressao linear multipla
Regressao linear multipla
aniziorochaaraujo
 
07 tópico 6 - autocorrelação
07   tópico 6 - autocorrelação07   tópico 6 - autocorrelação
07 tópico 6 - autocorrelação
Ricardo Bruno - Universidade Federal do Pará
 
Tópico 3 Testes de Hipóteses - 2 amostras
Tópico 3   Testes de Hipóteses - 2 amostrasTópico 3   Testes de Hipóteses - 2 amostras
Tópico 3 Testes de Hipóteses - 2 amostras
Ricardo Bruno - Universidade Federal do Pará
 
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Jean Paulo Mendes Alves
 
Modelos (S)ARIMA e extensões
Modelos (S)ARIMA e extensõesModelos (S)ARIMA e extensões
Modelos (S)ARIMA e extensões
Fernando A. B. Sabino da Silva
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
Mitsubishi Motors Brasil
 
Tópico 3 testes de hípoteses - 1 amostra
Tópico 3   testes de hípoteses - 1 amostraTópico 3   testes de hípoteses - 1 amostra
Tópico 3 testes de hípoteses - 1 amostra
Ricardo Bruno - Universidade Federal do Pará
 

Mais procurados (20)

A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
05 tópico 4 - multicolinearidade
05   tópico 4 - multicolinearidade05   tópico 4 - multicolinearidade
05 tópico 4 - multicolinearidade
 
econometria
 econometria econometria
econometria
 
Introdução à Regressão Linear
Introdução à Regressão LinearIntrodução à Regressão Linear
Introdução à Regressão Linear
 
Regressão - aula 04/04
Regressão - aula 04/04Regressão - aula 04/04
Regressão - aula 04/04
 
Análise de Componentes Principais
Análise de Componentes PrincipaisAnálise de Componentes Principais
Análise de Componentes Principais
 
03 tópico 2 - regressão multipla
03   tópico 2 - regressão multipla03   tópico 2 - regressão multipla
03 tópico 2 - regressão multipla
 
Prática de Regressão no SPSS
Prática de Regressão no SPSSPrática de Regressão no SPSS
Prática de Regressão no SPSS
 
Correlação
CorrelaçãoCorrelação
Correlação
 
Regressão - aula 03/04
Regressão - aula 03/04Regressão - aula 03/04
Regressão - aula 03/04
 
02 tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
02   tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA02   tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
02 tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
 
Vetores Autoregressivos
Vetores AutoregressivosVetores Autoregressivos
Vetores Autoregressivos
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
 
Regressao linear multipla
Regressao linear multiplaRegressao linear multipla
Regressao linear multipla
 
07 tópico 6 - autocorrelação
07   tópico 6 - autocorrelação07   tópico 6 - autocorrelação
07 tópico 6 - autocorrelação
 
Tópico 3 Testes de Hipóteses - 2 amostras
Tópico 3   Testes de Hipóteses - 2 amostrasTópico 3   Testes de Hipóteses - 2 amostras
Tópico 3 Testes de Hipóteses - 2 amostras
 
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
 
Modelos (S)ARIMA e extensões
Modelos (S)ARIMA e extensõesModelos (S)ARIMA e extensões
Modelos (S)ARIMA e extensões
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Tópico 3 testes de hípoteses - 1 amostra
Tópico 3   testes de hípoteses - 1 amostraTópico 3   testes de hípoteses - 1 amostra
Tópico 3 testes de hípoteses - 1 amostra
 

Semelhante a Cap 2 gujarati alunos

Apostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
Wannessa Souza
 
5.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_201510061453325.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_20151006145332
Samuel Ferreira da Silva
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma Amostra
Flávia Salame
 
Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
Vitor Vieira Vasconcelos
 
Regressao
RegressaoRegressao
Regressao
Nivaldo Torres
 
Linear regression model
Linear regression modelLinear regression model
Linear regression model
Gabriel Peixe
 
4426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-5514426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-551
Jenifer Ferreira
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
Iverson moya
 
Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4
diegogabandrade
 
Tópico 4 regressão linear simples 02
Tópico 4   regressão linear simples 02Tópico 4   regressão linear simples 02
Tópico 4 regressão linear simples 02
Ricardo Bruno - Universidade Federal do Pará
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
Leonel Boano
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
Robson Odé
 
Universidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdfUniversidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdf
amaroalmeida74
 
MGL_Aulasggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggg
MGL_AulasgggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggMGL_Aulasggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggg
MGL_Aulasggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggg
TrabalhoFinal3
 
GRUPO B - 4ª AV.pdf
GRUPO B - 4ª AV.pdfGRUPO B - 4ª AV.pdf
GRUPO B - 4ª AV.pdf
Gustavo Rocha
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
Andreza Cristina Paulo Lamounier
 
Aula 00
Aula 00Aula 00
Aula 00
Marcos Campos
 
Distribuição normal
Distribuição normalDistribuição normal
Amostragem
AmostragemAmostragem
Amostragem
AmostragemAmostragem

Semelhante a Cap 2 gujarati alunos (20)

Apostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
 
5.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_201510061453325.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_20151006145332
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma Amostra
 
Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
 
Regressao
RegressaoRegressao
Regressao
 
Linear regression model
Linear regression modelLinear regression model
Linear regression model
 
4426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-5514426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-551
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
 
Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4
 
Tópico 4 regressão linear simples 02
Tópico 4   regressão linear simples 02Tópico 4   regressão linear simples 02
Tópico 4 regressão linear simples 02
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
 
Universidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdfUniversidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdf
 
MGL_Aulasggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggg
MGL_AulasgggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggMGL_Aulasggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggg
MGL_Aulasggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggg
 
GRUPO B - 4ª AV.pdf
GRUPO B - 4ª AV.pdfGRUPO B - 4ª AV.pdf
GRUPO B - 4ª AV.pdf
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
 
Aula 00
Aula 00Aula 00
Aula 00
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Amostragem
AmostragemAmostragem
Amostragem
 
Amostragem
AmostragemAmostragem
Amostragem
 

Último

Aula 1 do livro de Ciências do aluno - sons
Aula 1 do livro de Ciências do aluno - sonsAula 1 do livro de Ciências do aluno - sons
Aula 1 do livro de Ciências do aluno - sons
Érika Rufo
 
slides de Didática 2.pdf para apresentar
slides de Didática 2.pdf para apresentarslides de Didática 2.pdf para apresentar
slides de Didática 2.pdf para apresentar
JoeteCarvalho
 
Vogais Ilustrados para alfabetização infantil
Vogais Ilustrados para alfabetização infantilVogais Ilustrados para alfabetização infantil
Vogais Ilustrados para alfabetização infantil
mamaeieby
 
Pintura Romana .pptx
Pintura Romana                     .pptxPintura Romana                     .pptx
Pintura Romana .pptx
TomasSousa7
 
Testes + soluções_Mensagens12 )11111.pdf
Testes + soluções_Mensagens12 )11111.pdfTestes + soluções_Mensagens12 )11111.pdf
Testes + soluções_Mensagens12 )11111.pdf
lveiga112
 
karl marx biografia resumida com suas obras e história de vida
karl marx biografia resumida com suas obras e história de vidakarl marx biografia resumida com suas obras e história de vida
karl marx biografia resumida com suas obras e história de vida
KleginaldoPaz2
 
Atividade de reforço de matemática 2º ano
Atividade de reforço de matemática 2º anoAtividade de reforço de matemática 2º ano
Atividade de reforço de matemática 2º ano
fernandacosta37763
 
Leis de Mendel - as ervilhas e a maneira simples de entender.ppt
Leis de Mendel - as ervilhas e a maneira simples de entender.pptLeis de Mendel - as ervilhas e a maneira simples de entender.ppt
Leis de Mendel - as ervilhas e a maneira simples de entender.ppt
PatriciaZanoli
 
Estrutura Pedagógica - Laboratório de Educação a Distância.ppt
Estrutura Pedagógica - Laboratório de Educação a Distância.pptEstrutura Pedagógica - Laboratório de Educação a Distância.ppt
Estrutura Pedagógica - Laboratório de Educação a Distância.ppt
livrosjovert
 
Aula 2 - Revisando o significado de fração - Parte 2.pptx
Aula 2 - Revisando o significado de fração - Parte 2.pptxAula 2 - Revisando o significado de fração - Parte 2.pptx
Aula 2 - Revisando o significado de fração - Parte 2.pptx
LILIANPRESTESSCUDELE
 
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptxSlides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
LuizHenriquedeAlmeid6
 
livro ciclo da agua educação infantil.pdf
livro ciclo da agua educação infantil.pdflivro ciclo da agua educação infantil.pdf
livro ciclo da agua educação infantil.pdf
cmeioctaciliabetesch
 
- TEMPLATE DA PRATICA - Psicomotricidade.pptx
- TEMPLATE DA PRATICA - Psicomotricidade.pptx- TEMPLATE DA PRATICA - Psicomotricidade.pptx
- TEMPLATE DA PRATICA - Psicomotricidade.pptx
LucianaCristina58
 
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
MessiasMarianoG
 
Potenciação e Radiciação de Números Racionais
Potenciação e Radiciação de Números RacionaisPotenciação e Radiciação de Números Racionais
Potenciação e Radiciação de Números Racionais
wagnermorais28
 
cronograma-enem-2024-planejativo-estudos.pdf
cronograma-enem-2024-planejativo-estudos.pdfcronograma-enem-2024-planejativo-estudos.pdf
cronograma-enem-2024-planejativo-estudos.pdf
todorokillmepls
 
000. Para rezar o terço - Junho - mês do Sagrado Coração de Jesús.pdf
000. Para rezar o terço - Junho - mês do Sagrado Coração de Jesús.pdf000. Para rezar o terço - Junho - mês do Sagrado Coração de Jesús.pdf
000. Para rezar o terço - Junho - mês do Sagrado Coração de Jesús.pdf
YeniferGarcia36
 
Reino-Vegetal plantas e demais conceitos .pptx
Reino-Vegetal plantas e demais conceitos .pptxReino-Vegetal plantas e demais conceitos .pptx
Reino-Vegetal plantas e demais conceitos .pptx
CarinaSantos916505
 
Educação trabalho HQ em sala de aula uma excelente ideia
Educação  trabalho HQ em sala de aula uma excelente  ideiaEducação  trabalho HQ em sala de aula uma excelente  ideia
Educação trabalho HQ em sala de aula uma excelente ideia
joseanesouza36
 
Leonardo da Vinci .pptx
Leonardo da Vinci                  .pptxLeonardo da Vinci                  .pptx
Leonardo da Vinci .pptx
TomasSousa7
 

Último (20)

Aula 1 do livro de Ciências do aluno - sons
Aula 1 do livro de Ciências do aluno - sonsAula 1 do livro de Ciências do aluno - sons
Aula 1 do livro de Ciências do aluno - sons
 
slides de Didática 2.pdf para apresentar
slides de Didática 2.pdf para apresentarslides de Didática 2.pdf para apresentar
slides de Didática 2.pdf para apresentar
 
Vogais Ilustrados para alfabetização infantil
Vogais Ilustrados para alfabetização infantilVogais Ilustrados para alfabetização infantil
Vogais Ilustrados para alfabetização infantil
 
Pintura Romana .pptx
Pintura Romana                     .pptxPintura Romana                     .pptx
Pintura Romana .pptx
 
Testes + soluções_Mensagens12 )11111.pdf
Testes + soluções_Mensagens12 )11111.pdfTestes + soluções_Mensagens12 )11111.pdf
Testes + soluções_Mensagens12 )11111.pdf
 
karl marx biografia resumida com suas obras e história de vida
karl marx biografia resumida com suas obras e história de vidakarl marx biografia resumida com suas obras e história de vida
karl marx biografia resumida com suas obras e história de vida
 
Atividade de reforço de matemática 2º ano
Atividade de reforço de matemática 2º anoAtividade de reforço de matemática 2º ano
Atividade de reforço de matemática 2º ano
 
Leis de Mendel - as ervilhas e a maneira simples de entender.ppt
Leis de Mendel - as ervilhas e a maneira simples de entender.pptLeis de Mendel - as ervilhas e a maneira simples de entender.ppt
Leis de Mendel - as ervilhas e a maneira simples de entender.ppt
 
Estrutura Pedagógica - Laboratório de Educação a Distância.ppt
Estrutura Pedagógica - Laboratório de Educação a Distância.pptEstrutura Pedagógica - Laboratório de Educação a Distância.ppt
Estrutura Pedagógica - Laboratório de Educação a Distância.ppt
 
Aula 2 - Revisando o significado de fração - Parte 2.pptx
Aula 2 - Revisando o significado de fração - Parte 2.pptxAula 2 - Revisando o significado de fração - Parte 2.pptx
Aula 2 - Revisando o significado de fração - Parte 2.pptx
 
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptxSlides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
 
livro ciclo da agua educação infantil.pdf
livro ciclo da agua educação infantil.pdflivro ciclo da agua educação infantil.pdf
livro ciclo da agua educação infantil.pdf
 
- TEMPLATE DA PRATICA - Psicomotricidade.pptx
- TEMPLATE DA PRATICA - Psicomotricidade.pptx- TEMPLATE DA PRATICA - Psicomotricidade.pptx
- TEMPLATE DA PRATICA - Psicomotricidade.pptx
 
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
 
Potenciação e Radiciação de Números Racionais
Potenciação e Radiciação de Números RacionaisPotenciação e Radiciação de Números Racionais
Potenciação e Radiciação de Números Racionais
 
cronograma-enem-2024-planejativo-estudos.pdf
cronograma-enem-2024-planejativo-estudos.pdfcronograma-enem-2024-planejativo-estudos.pdf
cronograma-enem-2024-planejativo-estudos.pdf
 
000. Para rezar o terço - Junho - mês do Sagrado Coração de Jesús.pdf
000. Para rezar o terço - Junho - mês do Sagrado Coração de Jesús.pdf000. Para rezar o terço - Junho - mês do Sagrado Coração de Jesús.pdf
000. Para rezar o terço - Junho - mês do Sagrado Coração de Jesús.pdf
 
Reino-Vegetal plantas e demais conceitos .pptx
Reino-Vegetal plantas e demais conceitos .pptxReino-Vegetal plantas e demais conceitos .pptx
Reino-Vegetal plantas e demais conceitos .pptx
 
Educação trabalho HQ em sala de aula uma excelente ideia
Educação  trabalho HQ em sala de aula uma excelente  ideiaEducação  trabalho HQ em sala de aula uma excelente  ideia
Educação trabalho HQ em sala de aula uma excelente ideia
 
Leonardo da Vinci .pptx
Leonardo da Vinci                  .pptxLeonardo da Vinci                  .pptx
Leonardo da Vinci .pptx
 

Cap 2 gujarati alunos

  • 1. Prof.SauloJardim–saulojardim@id.uff.br Cap 2. Análise de regressão com duas variáveis: algumas ideias básicas Prof. MSc. Saulo Jardim Modelagem Estatística
  • 2. Prof.SauloJardim–saulojardim@id.uff.br  Trataremos agora o conceito de regressão de maneira mais formal.  Regressão simples (com apenas duas variáveis).  A análise de regressão trata, em grande parte, da estimação e/ou previsão do valor médio (para a população) da variável dependente com base nos valores conhecidos, ou fixados, da variável explanatória.  Dados do Exemplo 1: Eles se referem auma população total de 60 famílias de uma comunidade hipotética e sua renda (X) e despesas de consumo(Y) semanais, ambas medidas em dólares. As 60 famílias foram divididas em dez grupos de renda(de $ 80 a $ 260) e as despesas semanais de cada família nos vários grupos são apresentadas na tabela.
  • 4. Prof.SauloJardim–saulojardim@id.uff.br  É importante distinguir esses valores esperados condicionais dos valores esperados incondicionais das despesas semanais de consumo, E(Y).  Se somarmos as despesas de consumo semanais das 60 famílias da população e dividirmos esse total por 60, obteremos o número $ 121,20 ($ 7.272/60), que é a média incondicional, ou esperada, das despesas de consumo semanais, E(Y);  Perguntas importantes:“Qual o valor esperado das despesas de consumo semanais médias de uma família?” Mas se perguntarmos: “Qual o valor esperado das despesas de consumo semanais de uma família cuja renda mensal é de $ 140?”.  Respostas: 121,20 e 101, respectivamente.
  • 5. Prof.SauloJardim–saulojardim@id.uff.br  Se unirmos os valores médios condicionais obteremos o que é conhecido como linha de regressão populacional (LRP) ou, de modo mais geral, a curva de regressão populacional.
  • 6. Prof.SauloJardim–saulojardim@id.uff.br  Conhecer a classe de renda pode nos permitir prever melhor o valor médio das despesas de consumo do que se não tivermos esse dado. Esta, é a essência da análise de regressão.  Em termos geométricos, uma curva de regressão populacional é apenas o local geométrico das médias condicionais da variável dependente para os valores fixados da(s) variável(is) explanatória(s).  Na figura abaixo, para cada X (isto é, nível de renda), há uma população de valores de Y (despesas de consumo semanais) que se espalham em torno da média (condicional) desses valores de Y. Para simplificarmos, pressupomos que esses valores de Y distribuem-se simetricamente em torno de seus respectivos valores médios (condicionais) e que a linha (ou curva) passa por esses valores médios (condicionais).
  • 8. Prof.SauloJardim–saulojardim@id.uff.br  Relembrando a definição de Regressão: A análise de regressão diz respeito ao estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis, as variáveis explanatórias, visando estimar e/ou prever o valor médio (da população) da primeira em termos dos valores conhecidos ou fixados (em amostragens repetidas) das segundas.
  • 9. Prof.SauloJardim–saulojardim@id.uff.br  Cada média condicional 𝐸(𝑌|𝑋𝑖) é uma função de 𝑋𝑖, em que 𝑋𝑖 é um dado valor de X. Simbolicamente,  Conhecida também como a função de esperança condicional (FEC) ou função de regressão populacional (FRP).  Qual é a forma assumida pela função f(𝑋𝑖)? Supondo que FRP 𝐸(𝑌|𝑋𝑖) é uma função linear de 𝑋𝑖 do tipo: CONCEITO DE FUNÇÃO DE REGRESSÃO POPULACIONAL (FRP)
  • 10. Prof.SauloJardim–saulojardim@id.uff.br  𝛽1 e 𝛽2 são parâmetros desconhecidos, mas fixos, chamados de coeficientes de regressão;  𝛽1 e 𝛽2 também são conhecidos como intercepto e coeficiente angular, respectivamente.  Nosso interese na Análise de Regreessão, é estimar os valores de incógnitas como 𝛽1 e 𝛽2com base nas observações de Y e X.
  • 11. Prof.SauloJardim–saulojardim@id.uff.br  Em termos geométricos, a curva de regressão nesse caso é uma reta.  Sob essa interpretação, uma função de regressão como 𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐 𝑿 𝟐 não é uma função linear, porque a variável X aparece com um expoente ou índice de 2. O SIGNIFICADO DO TERMO LINEAR LINEARIDADE NOS PARÂMETROS  Um modelo não linear nos parâmetros: 𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐 𝟐 X
  • 13. Prof.SauloJardim–saulojardim@id.uff.br  Tabela 2.1 e a Figura 2.1 mostram que as despesas de consumo de uma família não aumentam necessariamente quando aumenta seu nível de renda. CERTO ? ESPECIFICAÇÃO ESTOCÁSTICA DA FRP
  • 14. Prof.SauloJardim–saulojardim@id.uff.br  O que podemos dizer sobre a relação entre as despesas de consumo de uma família e um nível de renda? Vemos na Figura 2.1 que para um nível de renda 𝑋𝑖 as despesas médias de consumo de uma família agrupam-se em torno do consumo médio de todas as famílias deste nível 𝑋𝑖 , isto é, em torno de sua esperança condicional. Portanto, podemos expressar o desvio individual de 𝑌𝑖 em torno de seu valor esperado como a seguir:  em que o desvio 𝑢𝑖 é uma variável aleatória não-observável que assume valores positivos ou negativos. Tecnicamente, 𝑢𝑖 é conhecida como distúrbio estocástico ou termo de erro estocástico.
  • 15. Prof.SauloJardim–saulojardim@id.uff.br  Podemos dizer que a despesa de consumo de uma família individual, dado seu nível de renda, pode ser expressa como a soma de dois componentes: (1) 𝐸(𝑌|𝑋𝑖) , que é simplesmente o gasto médio em consumo de todas as famílias com o mesmo nível de renda (esse componente é conhecido como sistemático ou determinístico); e (2) 𝑢𝑖 , que é o componente aleatório ou não-sistemático.  Podemos escrever a equação da seguinte maneira:
  • 16. Prof.SauloJardim–saulojardim@id.uff.br  Se tomarmos o valor esperado nos dois lados da equação, obtemos:  em que levamos em consideração o fato de que o valor esperado de uma constante é a própria constante. Observe que 𝐸 𝑌 𝑋𝑖 , uma vez que o valor de 𝑋𝑖 é fixo, é uma constante.  Observe atentamente que, na Equação, tomamos a esperança condicional condicionada a um dado X. Como 𝐸 𝑌𝑖 𝑋𝑖 é o mesmo que 𝐸 𝑌 𝑋𝑖 , a Equação implica que
  • 17. Prof.SauloJardim–saulojardim@id.uff.br  Assim, a suposição de que a linha de regressão passa pelas médias condicionais de Y implica que os valores médios condicionais de 𝑢𝑖 (condicionados a um dado X) sejam iguais a zero.  O termo de erro ui representa todas as variáveis omitidas no modelo, mas que coletivamente afetam Y.  A pergunta óbvia é: por que não introduzir essas variáveis explicitamente no modelo? Ou seja, por que não formular um modelo de regressão com o máximo de variáveis possíveis? Há muitas razões: O SIGNIFICADO DO TERMO “ERRO ESTOCÁSTICO”
  • 18. Prof.SauloJardim–saulojardim@id.uff.br  1- Caráter vago da teoria.  2- Indisponibilidade de dados.  3- Variáveis essenciais versus variáveis periféricas/secundárias.  4- Caráter intrinsecamente aleatório do comportamento humano (mesmo se conseguirmos incluir todas as variáveis relevantes no modelo, sempre haverá uma aleatoriedade “intrínseca” nos Y individuais que não pode ser explicada por mais que nos esforcemos para tanto. Os termos de erro, os u, podem refletir bem a aleatoriedade intrínseca.)  5- Variáveis proxy pouco adequadas.  6- Princípio da parcimônia (de acordo com a navalha de Occam,12 o ideal seria formular o modelo de regressão mais simples possível.).  7-Forma funcional errada (função linear ou não linear?).
  • 19. Prof.SauloJardim–saulojardim@id.uff.br  Nossa tarefa agora é estimar a função de regressão com base em informações amostrais.  A pergunta é: com base na amostra da Tabela 2.4, é possível prever as despesas médias de consumo semanais Y para a população como um todo correspondentes aos X escolhidos? Em outras palavras, podemos estimar a FRP com base nos dados da amostra?  Não seremos capazes de estimar “precisamente” a FRP devido a variações amostrais. A FUNÇÃO DE REGRESSÃO AMOSTRAL (FRA)
  • 22. Prof.SauloJardim–saulojardim@id.uff.br  Qual das duas linhas de regressão representa a linha de regressão populacional “real”?  Não há como ter certeza absoluta de qual das linhas de regressão representa a verdadeira linha (ou curva) de regressão populacional. Devido às variações amostrais, elas são, no máximo, aproximações da verdadeira regressão populacional.  Agora, tal como no caso da FRP subjacente à linha de regressão populacional, podemos formular o conceito de função de regressão amostral (FRA) para representar a linha de regressão da amostra.
  • 23. Prof.SauloJardim–saulojardim@id.uff.br  Observe que um estimador, também conhecido como estatística (amostral), é apenas uma regra ou fórmula ou método que nos diz como estimar o parâmetro da população com base nas informações oferecidas pela amostra que temos à mão. Um valor numérico em particular obtido pela aplicação do estimador é conhecido como estimativa.  Podemos expressar a FRA na Equação em sua forma estocástica como a seguir:
  • 24. Prof.SauloJardim–saulojardim@id.uff.br  Resumindo, então, verificamos que nosso objetivo primordial na análise de regressão é estimar a FRP:  com base na FRA  Obviamente, 𝑌𝑖 superestima a verdadeira 𝐸 𝑌 𝑋𝑖 para o 𝑋𝑖 nela mostrado. Da mesma forma, para cada 𝑋𝑖 à esquerda do ponto A, a FRA subestimará a verdadeira FRP. Contudo, pode ver facilmente que essas sobre e subestimações são inevitáveis devido às variações amostrais.
  • 26. Prof.SauloJardim–saulojardim@id.uff.br  A pergunta crítica agora é: sabendo que a FRA não é mais do que uma aproximação da FRP, podemos formular uma regra ou um método que torne essa aproximação a mais próxima possível? Em outras palavras, como devemos formular a FRA para que 𝛽1fique o mais próximo possível do verdadeiro 𝜷 𝟏 e 𝛽2 do verdadeiro 𝜷 𝟐 , mesmo que nunca venhamos a saber quais são os verdadeiros 𝜷 𝟏 e 𝜷 𝟐?  A resposta para essa pergunta ocupará grande parte de nossa atenção no Capítulo 3. Aqui destacamos que é possível desenvolver procedimentos que nos digam como formular a FRA a fim de espelhar FRP o mais fielmente possível. É fascinante considerar que isso pode ser feito mesmo que nunca determinemos a FRP real.
  • 29. Prof.SauloJardim–saulojardim@id.uff.br Anos de Estudo Salário Médio ($/hora) Número de pessoas 6 4,45 3 7 5,77 5 8 5,97 15 9 7,33 12 10 7,31 17 11 5,58 27 12 7,81 218 13 7,83 37 14 11,02 56 15 10,67 13 16 10,83 70 17 13,61 24 18 13,53 31