SlideShare uma empresa Scribd logo
1 de 33
Baixar para ler offline
Prof.SauloJardim–saulojardim@id.uff.br
Cap 2. Análise de regressão com
duas variáveis: algumas
ideias básicas
Prof. MSc. Saulo Jardim
Modelagem Estatística
Prof.SauloJardim–saulojardim@id.uff.br
 Trataremos agora o conceito de regressão de maneira mais formal.
 Regressão simples (com apenas duas variáveis).
 A análise de regressão trata, em grande parte, da estimação e/ou
previsão do valor médio (para a população) da variável dependente
com base nos valores conhecidos, ou fixados, da variável
explanatória.
 Dados do Exemplo 1: Eles se referem auma população total de 60
famílias de uma comunidade hipotética e sua renda (X) e despesas de
consumo(Y) semanais, ambas medidas em dólares. As 60 famílias foram
divididas em dez grupos de renda(de $ 80 a $ 260) e as despesas
semanais de cada família nos vários grupos são apresentadas na
tabela.
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 É importante distinguir esses valores esperados condicionais dos
valores esperados incondicionais das despesas semanais de consumo,
E(Y).
 Se somarmos as despesas de consumo semanais das 60 famílias da
população e dividirmos esse total por 60, obteremos o número $
121,20 ($ 7.272/60), que é a média incondicional, ou esperada, das
despesas de consumo semanais, E(Y);
 Perguntas importantes:“Qual o valor esperado das despesas de consumo
semanais médias de uma família?” Mas se perguntarmos: “Qual o valor
esperado das despesas de consumo semanais de uma família cuja renda
mensal é de $ 140?”.
 Respostas: 121,20 e 101, respectivamente.
Prof.SauloJardim–saulojardim@id.uff.br
 Se unirmos os valores médios condicionais obteremos o que é
conhecido como linha de regressão populacional (LRP) ou, de modo
mais geral, a curva de regressão populacional.
Prof.SauloJardim–saulojardim@id.uff.br
 Conhecer a classe de renda pode nos permitir prever melhor o valor
médio das despesas de consumo do que se não tivermos esse dado.
Esta, é a essência da análise de regressão.
 Em termos geométricos, uma curva de regressão populacional é apenas
o local geométrico das médias condicionais da variável dependente
para os valores fixados da(s) variável(is) explanatória(s).
 Na figura abaixo, para cada X (isto é, nível de renda), há uma
população de valores de Y (despesas de consumo semanais) que se
espalham em torno da média (condicional) desses valores de Y. Para
simplificarmos, pressupomos que esses valores de Y distribuem-se
simetricamente em torno de seus respectivos valores médios
(condicionais) e que a linha (ou curva) passa por esses valores
médios (condicionais).
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 Relembrando a definição de Regressão:
A análise de regressão diz respeito ao estudo da dependência
de uma variável, a variável dependente, em relação a uma ou
mais variáveis, as variáveis explanatórias, visando estimar
e/ou prever o valor médio (da população) da primeira em
termos dos valores conhecidos ou fixados (em amostragens
repetidas) das segundas.
Prof.SauloJardim–saulojardim@id.uff.br
 Cada média condicional 𝐸(𝑌|𝑋𝑖) é uma função de 𝑋𝑖, em que 𝑋𝑖 é um dado
valor de X. Simbolicamente,
 Conhecida também como a função de esperança condicional (FEC) ou
função de regressão populacional (FRP).
 Qual é a forma assumida pela função f(𝑋𝑖)? Supondo que FRP 𝐸(𝑌|𝑋𝑖) é
uma função linear de 𝑋𝑖 do tipo:
CONCEITO DE FUNÇÃO DE REGRESSÃO POPULACIONAL (FRP)
Prof.SauloJardim–saulojardim@id.uff.br
 𝛽1 e 𝛽2 são parâmetros desconhecidos, mas fixos, chamados de
coeficientes de regressão;
 𝛽1 e 𝛽2 também são conhecidos como intercepto e coeficiente angular,
respectivamente.
 Nosso interese na Análise de Regreessão, é estimar os valores de
incógnitas como 𝛽1 e 𝛽2com base nas observações de Y e X.
Prof.SauloJardim–saulojardim@id.uff.br
 Em termos geométricos, a curva de regressão nesse caso é uma reta.
 Sob essa interpretação, uma função de regressão como
𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐 𝑿 𝟐
não é uma função linear, porque a variável X aparece com um expoente
ou índice de 2.
O SIGNIFICADO DO TERMO LINEAR
LINEARIDADE NOS PARÂMETROS
 Um modelo não linear nos parâmetros: 𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐
𝟐
X
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 Tabela 2.1 e a Figura
2.1 mostram que as
despesas de consumo de
uma família não
aumentam
necessariamente quando
aumenta seu nível de
renda. CERTO ?
ESPECIFICAÇÃO ESTOCÁSTICA DA FRP
Prof.SauloJardim–saulojardim@id.uff.br
 O que podemos dizer sobre a relação entre as despesas de consumo de
uma família e um nível de renda? Vemos na Figura 2.1 que para um
nível de renda 𝑋𝑖 as despesas médias de consumo de uma família
agrupam-se em torno do consumo médio de todas as famílias deste
nível 𝑋𝑖 , isto é, em torno de sua esperança condicional. Portanto,
podemos expressar o desvio individual de 𝑌𝑖 em torno de seu valor
esperado como a seguir:
 em que o desvio 𝑢𝑖 é uma variável aleatória não-observável que assume
valores positivos ou negativos. Tecnicamente, 𝑢𝑖 é conhecida como
distúrbio estocástico ou termo de erro estocástico.
Prof.SauloJardim–saulojardim@id.uff.br
 Podemos dizer que a despesa de consumo de uma família individual,
dado seu nível de renda, pode ser expressa como a soma de dois
componentes: (1) 𝐸(𝑌|𝑋𝑖) , que é simplesmente o gasto médio em consumo
de todas as famílias com o mesmo nível de renda (esse componente é
conhecido como sistemático ou determinístico); e (2) 𝑢𝑖 , que é o
componente aleatório ou não-sistemático.
 Podemos escrever a equação da seguinte maneira:
Prof.SauloJardim–saulojardim@id.uff.br
 Se tomarmos o valor esperado nos dois lados da equação, obtemos:
 em que levamos em consideração o fato de que o valor esperado de uma
constante é a própria constante. Observe que 𝐸 𝑌 𝑋𝑖 , uma vez que o
valor de 𝑋𝑖 é fixo, é uma constante.
 Observe atentamente que, na Equação, tomamos a esperança condicional
condicionada a um dado X. Como 𝐸 𝑌𝑖 𝑋𝑖 é o mesmo que 𝐸 𝑌 𝑋𝑖 , a
Equação implica que
Prof.SauloJardim–saulojardim@id.uff.br
 Assim, a suposição de que a linha de regressão passa pelas médias
condicionais de Y implica que os valores médios condicionais de 𝑢𝑖
(condicionados a um dado X) sejam iguais a zero.
 O termo de erro ui representa todas as variáveis omitidas no modelo,
mas que coletivamente afetam Y.
 A pergunta óbvia é: por que não introduzir essas variáveis
explicitamente no modelo? Ou seja, por que não formular um modelo de
regressão com o máximo de variáveis possíveis? Há muitas razões:
O SIGNIFICADO DO TERMO “ERRO ESTOCÁSTICO”
Prof.SauloJardim–saulojardim@id.uff.br
 1- Caráter vago da teoria.
 2- Indisponibilidade de dados.
 3- Variáveis essenciais versus variáveis periféricas/secundárias.
 4- Caráter intrinsecamente aleatório do comportamento humano (mesmo se
conseguirmos incluir todas as variáveis relevantes no modelo, sempre haverá uma aleatoriedade
“intrínseca” nos Y individuais que não pode ser explicada por mais que nos esforcemos para tanto. Os
termos de erro, os u, podem refletir bem a aleatoriedade intrínseca.)
 5- Variáveis proxy pouco adequadas.
 6- Princípio da parcimônia (de acordo com a navalha de Occam,12 o ideal seria formular
o modelo de regressão mais simples possível.).
 7-Forma funcional errada (função linear ou não linear?).
Prof.SauloJardim–saulojardim@id.uff.br
 Nossa tarefa agora é estimar a função de regressão com base em
informações amostrais.
 A pergunta é: com base na amostra da Tabela 2.4, é possível prever
as despesas médias de consumo semanais Y para a população como um
todo correspondentes aos X escolhidos? Em outras palavras, podemos
estimar a FRP com base nos dados da amostra?
 Não seremos capazes de estimar “precisamente” a FRP devido a
variações amostrais.
A FUNÇÃO DE REGRESSÃO AMOSTRAL (FRA)
Prof.SauloJardim–saulojardim@id.uff.br
 Exemplo:
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 Qual das duas linhas de regressão representa a linha de regressão
populacional “real”?
 Não há como ter certeza absoluta de qual das linhas de regressão
representa a verdadeira linha (ou curva) de regressão populacional.
Devido às variações amostrais, elas são, no máximo, aproximações da
verdadeira regressão populacional.
 Agora, tal como no caso da FRP subjacente à linha de regressão
populacional, podemos formular o conceito de função de regressão
amostral (FRA) para representar a linha de regressão da amostra.
Prof.SauloJardim–saulojardim@id.uff.br
 Observe que um estimador, também conhecido como estatística
(amostral), é apenas uma regra ou fórmula ou método que nos diz como
estimar o parâmetro da população com base nas informações oferecidas
pela amostra que temos à mão. Um valor numérico em particular obtido
pela aplicação do estimador é conhecido como estimativa.
 Podemos expressar a FRA na Equação em sua forma estocástica como a
seguir:
Prof.SauloJardim–saulojardim@id.uff.br
 Resumindo, então, verificamos que nosso objetivo primordial na
análise de regressão é estimar a FRP:
 com base na FRA
 Obviamente, 𝑌𝑖 superestima a verdadeira 𝐸 𝑌 𝑋𝑖 para o 𝑋𝑖 nela
mostrado. Da mesma forma, para cada 𝑋𝑖 à esquerda do ponto A, a FRA
subestimará a verdadeira FRP. Contudo, pode ver facilmente que essas
sobre e subestimações são inevitáveis devido às variações amostrais.
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
 A pergunta crítica agora é: sabendo que a FRA não é mais do que uma
aproximação da FRP, podemos formular uma regra ou um método que
torne essa aproximação a mais próxima possível? Em outras palavras,
como devemos formular a FRA para que 𝛽1fique o mais próximo possível
do verdadeiro 𝜷 𝟏 e 𝛽2 do verdadeiro 𝜷 𝟐 , mesmo que nunca venhamos a
saber quais são os verdadeiros 𝜷 𝟏 e 𝜷 𝟐?
 A resposta para essa pergunta ocupará grande parte de nossa atenção
no Capítulo 3. Aqui destacamos que é possível desenvolver
procedimentos que nos digam como formular a FRA a fim de espelhar
FRP o mais fielmente possível. É fascinante considerar que isso pode
ser feito mesmo que nunca determinemos a FRP real.
Prof.SauloJardim–saulojardim@id.uff.br
Aplicação no R
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
Anos de Estudo Salário Médio ($/hora) Número de pessoas
6 4,45 3
7 5,77 5
8 5,97 15
9 7,33 12
10 7,31 17
11 5,58 27
12 7,81 218
13 7,83 37
14 11,02 56
15 10,67 13
16 10,83 70
17 13,61 24
18 13,53 31
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br
Prof.SauloJardim–saulojardim@id.uff.br

Mais conteúdo relacionado

Mais procurados

A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
 
Regressão - aula 04/04
Regressão - aula 04/04Regressão - aula 04/04
Regressão - aula 04/04Rodrigo de Sá
 
Análise de Componentes Principais
Análise de Componentes PrincipaisAnálise de Componentes Principais
Análise de Componentes PrincipaisCélia M. D. Sales
 
Regressão - aula 03/04
Regressão - aula 03/04Regressão - aula 03/04
Regressão - aula 03/04Rodrigo de Sá
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Rodrigo Rodrigues
 
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Jean Paulo Mendes Alves
 

Mais procurados (20)

A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
05 tópico 4 - multicolinearidade
05   tópico 4 - multicolinearidade05   tópico 4 - multicolinearidade
05 tópico 4 - multicolinearidade
 
econometria
 econometria econometria
econometria
 
Introdução à Regressão Linear
Introdução à Regressão LinearIntrodução à Regressão Linear
Introdução à Regressão Linear
 
Regressão - aula 04/04
Regressão - aula 04/04Regressão - aula 04/04
Regressão - aula 04/04
 
Análise de Componentes Principais
Análise de Componentes PrincipaisAnálise de Componentes Principais
Análise de Componentes Principais
 
03 tópico 2 - regressão multipla
03   tópico 2 - regressão multipla03   tópico 2 - regressão multipla
03 tópico 2 - regressão multipla
 
Prática de Regressão no SPSS
Prática de Regressão no SPSSPrática de Regressão no SPSS
Prática de Regressão no SPSS
 
Correlação
CorrelaçãoCorrelação
Correlação
 
Regressão - aula 03/04
Regressão - aula 03/04Regressão - aula 03/04
Regressão - aula 03/04
 
02 tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
02   tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA02   tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
02 tópico 1 - regressão linear simples 02 - Econometria - Graduação - UFPA
 
Vetores Autoregressivos
Vetores AutoregressivosVetores Autoregressivos
Vetores Autoregressivos
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
 
Regressao linear multipla
Regressao linear multiplaRegressao linear multipla
Regressao linear multipla
 
07 tópico 6 - autocorrelação
07   tópico 6 - autocorrelação07   tópico 6 - autocorrelação
07 tópico 6 - autocorrelação
 
Tópico 3 Testes de Hipóteses - 2 amostras
Tópico 3   Testes de Hipóteses - 2 amostrasTópico 3   Testes de Hipóteses - 2 amostras
Tópico 3 Testes de Hipóteses - 2 amostras
 
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
 
Modelos (S)ARIMA e extensões
Modelos (S)ARIMA e extensõesModelos (S)ARIMA e extensões
Modelos (S)ARIMA e extensões
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Tópico 3 testes de hípoteses - 1 amostra
Tópico 3   testes de hípoteses - 1 amostraTópico 3   testes de hípoteses - 1 amostra
Tópico 3 testes de hípoteses - 1 amostra
 

Semelhante a Regressão linear com duas variáveis: conceitos básicos

Semelhante a Regressão linear com duas variáveis: conceitos básicos (20)

Apostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
 
5.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_201510061453325.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_20151006145332
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma Amostra
 
Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
 
Regressao
RegressaoRegressao
Regressao
 
Linear regression model
Linear regression modelLinear regression model
Linear regression model
 
4426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-5514426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-551
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
 
Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4
 
Tópico 4 regressão linear simples 02
Tópico 4   regressão linear simples 02Tópico 4   regressão linear simples 02
Tópico 4 regressão linear simples 02
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
 
Universidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdfUniversidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdf
 
GRUPO B - 4ª AV.pdf
GRUPO B - 4ª AV.pdfGRUPO B - 4ª AV.pdf
GRUPO B - 4ª AV.pdf
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
 
Aula 00
Aula 00Aula 00
Aula 00
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Amostragem
AmostragemAmostragem
Amostragem
 
Amostragem
AmostragemAmostragem
Amostragem
 
Bioestatística
 Bioestatística Bioestatística
Bioestatística
 

Último

Livro O QUE É LUGAR DE FALA - Autora Djamila Ribeiro
Livro O QUE É LUGAR DE FALA  - Autora Djamila RibeiroLivro O QUE É LUGAR DE FALA  - Autora Djamila Ribeiro
Livro O QUE É LUGAR DE FALA - Autora Djamila RibeiroMarcele Ravasio
 
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptxthaisamaral9365923
 
trabalho wanda rocha ditadura
trabalho wanda rocha ditaduratrabalho wanda rocha ditadura
trabalho wanda rocha ditaduraAdryan Luiz
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxLuizHenriquedeAlmeid6
 
[Bloco 7] Recomposição das Aprendizagens.pptx
[Bloco 7] Recomposição das Aprendizagens.pptx[Bloco 7] Recomposição das Aprendizagens.pptx
[Bloco 7] Recomposição das Aprendizagens.pptxLinoReisLino
 
Bullying - Atividade com caça- palavras
Bullying   - Atividade com  caça- palavrasBullying   - Atividade com  caça- palavras
Bullying - Atividade com caça- palavrasMary Alvarenga
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOColégio Santa Teresinha
 
1.ª Fase do Modernismo Brasileira - Contexto histórico, autores e obras.
1.ª Fase do Modernismo Brasileira - Contexto histórico, autores e obras.1.ª Fase do Modernismo Brasileira - Contexto histórico, autores e obras.
1.ª Fase do Modernismo Brasileira - Contexto histórico, autores e obras.MrPitobaldo
 
A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.silves15
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Centro Jacques Delors
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinhaMary Alvarenga
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxleandropereira983288
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasRosalina Simão Nunes
 
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptxAULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptxLaurindo6
 
Nova BNCC Atualizada para novas pesquisas
Nova BNCC Atualizada para novas pesquisasNova BNCC Atualizada para novas pesquisas
Nova BNCC Atualizada para novas pesquisasraveccavp
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxLuizHenriquedeAlmeid6
 
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBCRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBAline Santana
 

Último (20)

Livro O QUE É LUGAR DE FALA - Autora Djamila Ribeiro
Livro O QUE É LUGAR DE FALA  - Autora Djamila RibeiroLivro O QUE É LUGAR DE FALA  - Autora Djamila Ribeiro
Livro O QUE É LUGAR DE FALA - Autora Djamila Ribeiro
 
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
 
trabalho wanda rocha ditadura
trabalho wanda rocha ditaduratrabalho wanda rocha ditadura
trabalho wanda rocha ditadura
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
 
[Bloco 7] Recomposição das Aprendizagens.pptx
[Bloco 7] Recomposição das Aprendizagens.pptx[Bloco 7] Recomposição das Aprendizagens.pptx
[Bloco 7] Recomposição das Aprendizagens.pptx
 
Bullying - Atividade com caça- palavras
Bullying   - Atividade com  caça- palavrasBullying   - Atividade com  caça- palavras
Bullying - Atividade com caça- palavras
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
 
XI OLIMPÍADAS DA LÍNGUA PORTUGUESA -
XI OLIMPÍADAS DA LÍNGUA PORTUGUESA      -XI OLIMPÍADAS DA LÍNGUA PORTUGUESA      -
XI OLIMPÍADAS DA LÍNGUA PORTUGUESA -
 
CINEMATICA DE LOS MATERIALES Y PARTICULA
CINEMATICA DE LOS MATERIALES Y PARTICULACINEMATICA DE LOS MATERIALES Y PARTICULA
CINEMATICA DE LOS MATERIALES Y PARTICULA
 
1.ª Fase do Modernismo Brasileira - Contexto histórico, autores e obras.
1.ª Fase do Modernismo Brasileira - Contexto histórico, autores e obras.1.ª Fase do Modernismo Brasileira - Contexto histórico, autores e obras.
1.ª Fase do Modernismo Brasileira - Contexto histórico, autores e obras.
 
A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.
 
Em tempo de Quaresma .
Em tempo de Quaresma                            .Em tempo de Quaresma                            .
Em tempo de Quaresma .
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinha
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptx
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
 
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptxAULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
 
Nova BNCC Atualizada para novas pesquisas
Nova BNCC Atualizada para novas pesquisasNova BNCC Atualizada para novas pesquisas
Nova BNCC Atualizada para novas pesquisas
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
 
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBCRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
 

Regressão linear com duas variáveis: conceitos básicos

  • 1. Prof.SauloJardim–saulojardim@id.uff.br Cap 2. Análise de regressão com duas variáveis: algumas ideias básicas Prof. MSc. Saulo Jardim Modelagem Estatística
  • 2. Prof.SauloJardim–saulojardim@id.uff.br  Trataremos agora o conceito de regressão de maneira mais formal.  Regressão simples (com apenas duas variáveis).  A análise de regressão trata, em grande parte, da estimação e/ou previsão do valor médio (para a população) da variável dependente com base nos valores conhecidos, ou fixados, da variável explanatória.  Dados do Exemplo 1: Eles se referem auma população total de 60 famílias de uma comunidade hipotética e sua renda (X) e despesas de consumo(Y) semanais, ambas medidas em dólares. As 60 famílias foram divididas em dez grupos de renda(de $ 80 a $ 260) e as despesas semanais de cada família nos vários grupos são apresentadas na tabela.
  • 4. Prof.SauloJardim–saulojardim@id.uff.br  É importante distinguir esses valores esperados condicionais dos valores esperados incondicionais das despesas semanais de consumo, E(Y).  Se somarmos as despesas de consumo semanais das 60 famílias da população e dividirmos esse total por 60, obteremos o número $ 121,20 ($ 7.272/60), que é a média incondicional, ou esperada, das despesas de consumo semanais, E(Y);  Perguntas importantes:“Qual o valor esperado das despesas de consumo semanais médias de uma família?” Mas se perguntarmos: “Qual o valor esperado das despesas de consumo semanais de uma família cuja renda mensal é de $ 140?”.  Respostas: 121,20 e 101, respectivamente.
  • 5. Prof.SauloJardim–saulojardim@id.uff.br  Se unirmos os valores médios condicionais obteremos o que é conhecido como linha de regressão populacional (LRP) ou, de modo mais geral, a curva de regressão populacional.
  • 6. Prof.SauloJardim–saulojardim@id.uff.br  Conhecer a classe de renda pode nos permitir prever melhor o valor médio das despesas de consumo do que se não tivermos esse dado. Esta, é a essência da análise de regressão.  Em termos geométricos, uma curva de regressão populacional é apenas o local geométrico das médias condicionais da variável dependente para os valores fixados da(s) variável(is) explanatória(s).  Na figura abaixo, para cada X (isto é, nível de renda), há uma população de valores de Y (despesas de consumo semanais) que se espalham em torno da média (condicional) desses valores de Y. Para simplificarmos, pressupomos que esses valores de Y distribuem-se simetricamente em torno de seus respectivos valores médios (condicionais) e que a linha (ou curva) passa por esses valores médios (condicionais).
  • 8. Prof.SauloJardim–saulojardim@id.uff.br  Relembrando a definição de Regressão: A análise de regressão diz respeito ao estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis, as variáveis explanatórias, visando estimar e/ou prever o valor médio (da população) da primeira em termos dos valores conhecidos ou fixados (em amostragens repetidas) das segundas.
  • 9. Prof.SauloJardim–saulojardim@id.uff.br  Cada média condicional 𝐸(𝑌|𝑋𝑖) é uma função de 𝑋𝑖, em que 𝑋𝑖 é um dado valor de X. Simbolicamente,  Conhecida também como a função de esperança condicional (FEC) ou função de regressão populacional (FRP).  Qual é a forma assumida pela função f(𝑋𝑖)? Supondo que FRP 𝐸(𝑌|𝑋𝑖) é uma função linear de 𝑋𝑖 do tipo: CONCEITO DE FUNÇÃO DE REGRESSÃO POPULACIONAL (FRP)
  • 10. Prof.SauloJardim–saulojardim@id.uff.br  𝛽1 e 𝛽2 são parâmetros desconhecidos, mas fixos, chamados de coeficientes de regressão;  𝛽1 e 𝛽2 também são conhecidos como intercepto e coeficiente angular, respectivamente.  Nosso interese na Análise de Regreessão, é estimar os valores de incógnitas como 𝛽1 e 𝛽2com base nas observações de Y e X.
  • 11. Prof.SauloJardim–saulojardim@id.uff.br  Em termos geométricos, a curva de regressão nesse caso é uma reta.  Sob essa interpretação, uma função de regressão como 𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐 𝑿 𝟐 não é uma função linear, porque a variável X aparece com um expoente ou índice de 2. O SIGNIFICADO DO TERMO LINEAR LINEARIDADE NOS PARÂMETROS  Um modelo não linear nos parâmetros: 𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐 𝟐 X
  • 13. Prof.SauloJardim–saulojardim@id.uff.br  Tabela 2.1 e a Figura 2.1 mostram que as despesas de consumo de uma família não aumentam necessariamente quando aumenta seu nível de renda. CERTO ? ESPECIFICAÇÃO ESTOCÁSTICA DA FRP
  • 14. Prof.SauloJardim–saulojardim@id.uff.br  O que podemos dizer sobre a relação entre as despesas de consumo de uma família e um nível de renda? Vemos na Figura 2.1 que para um nível de renda 𝑋𝑖 as despesas médias de consumo de uma família agrupam-se em torno do consumo médio de todas as famílias deste nível 𝑋𝑖 , isto é, em torno de sua esperança condicional. Portanto, podemos expressar o desvio individual de 𝑌𝑖 em torno de seu valor esperado como a seguir:  em que o desvio 𝑢𝑖 é uma variável aleatória não-observável que assume valores positivos ou negativos. Tecnicamente, 𝑢𝑖 é conhecida como distúrbio estocástico ou termo de erro estocástico.
  • 15. Prof.SauloJardim–saulojardim@id.uff.br  Podemos dizer que a despesa de consumo de uma família individual, dado seu nível de renda, pode ser expressa como a soma de dois componentes: (1) 𝐸(𝑌|𝑋𝑖) , que é simplesmente o gasto médio em consumo de todas as famílias com o mesmo nível de renda (esse componente é conhecido como sistemático ou determinístico); e (2) 𝑢𝑖 , que é o componente aleatório ou não-sistemático.  Podemos escrever a equação da seguinte maneira:
  • 16. Prof.SauloJardim–saulojardim@id.uff.br  Se tomarmos o valor esperado nos dois lados da equação, obtemos:  em que levamos em consideração o fato de que o valor esperado de uma constante é a própria constante. Observe que 𝐸 𝑌 𝑋𝑖 , uma vez que o valor de 𝑋𝑖 é fixo, é uma constante.  Observe atentamente que, na Equação, tomamos a esperança condicional condicionada a um dado X. Como 𝐸 𝑌𝑖 𝑋𝑖 é o mesmo que 𝐸 𝑌 𝑋𝑖 , a Equação implica que
  • 17. Prof.SauloJardim–saulojardim@id.uff.br  Assim, a suposição de que a linha de regressão passa pelas médias condicionais de Y implica que os valores médios condicionais de 𝑢𝑖 (condicionados a um dado X) sejam iguais a zero.  O termo de erro ui representa todas as variáveis omitidas no modelo, mas que coletivamente afetam Y.  A pergunta óbvia é: por que não introduzir essas variáveis explicitamente no modelo? Ou seja, por que não formular um modelo de regressão com o máximo de variáveis possíveis? Há muitas razões: O SIGNIFICADO DO TERMO “ERRO ESTOCÁSTICO”
  • 18. Prof.SauloJardim–saulojardim@id.uff.br  1- Caráter vago da teoria.  2- Indisponibilidade de dados.  3- Variáveis essenciais versus variáveis periféricas/secundárias.  4- Caráter intrinsecamente aleatório do comportamento humano (mesmo se conseguirmos incluir todas as variáveis relevantes no modelo, sempre haverá uma aleatoriedade “intrínseca” nos Y individuais que não pode ser explicada por mais que nos esforcemos para tanto. Os termos de erro, os u, podem refletir bem a aleatoriedade intrínseca.)  5- Variáveis proxy pouco adequadas.  6- Princípio da parcimônia (de acordo com a navalha de Occam,12 o ideal seria formular o modelo de regressão mais simples possível.).  7-Forma funcional errada (função linear ou não linear?).
  • 19. Prof.SauloJardim–saulojardim@id.uff.br  Nossa tarefa agora é estimar a função de regressão com base em informações amostrais.  A pergunta é: com base na amostra da Tabela 2.4, é possível prever as despesas médias de consumo semanais Y para a população como um todo correspondentes aos X escolhidos? Em outras palavras, podemos estimar a FRP com base nos dados da amostra?  Não seremos capazes de estimar “precisamente” a FRP devido a variações amostrais. A FUNÇÃO DE REGRESSÃO AMOSTRAL (FRA)
  • 22. Prof.SauloJardim–saulojardim@id.uff.br  Qual das duas linhas de regressão representa a linha de regressão populacional “real”?  Não há como ter certeza absoluta de qual das linhas de regressão representa a verdadeira linha (ou curva) de regressão populacional. Devido às variações amostrais, elas são, no máximo, aproximações da verdadeira regressão populacional.  Agora, tal como no caso da FRP subjacente à linha de regressão populacional, podemos formular o conceito de função de regressão amostral (FRA) para representar a linha de regressão da amostra.
  • 23. Prof.SauloJardim–saulojardim@id.uff.br  Observe que um estimador, também conhecido como estatística (amostral), é apenas uma regra ou fórmula ou método que nos diz como estimar o parâmetro da população com base nas informações oferecidas pela amostra que temos à mão. Um valor numérico em particular obtido pela aplicação do estimador é conhecido como estimativa.  Podemos expressar a FRA na Equação em sua forma estocástica como a seguir:
  • 24. Prof.SauloJardim–saulojardim@id.uff.br  Resumindo, então, verificamos que nosso objetivo primordial na análise de regressão é estimar a FRP:  com base na FRA  Obviamente, 𝑌𝑖 superestima a verdadeira 𝐸 𝑌 𝑋𝑖 para o 𝑋𝑖 nela mostrado. Da mesma forma, para cada 𝑋𝑖 à esquerda do ponto A, a FRA subestimará a verdadeira FRP. Contudo, pode ver facilmente que essas sobre e subestimações são inevitáveis devido às variações amostrais.
  • 26. Prof.SauloJardim–saulojardim@id.uff.br  A pergunta crítica agora é: sabendo que a FRA não é mais do que uma aproximação da FRP, podemos formular uma regra ou um método que torne essa aproximação a mais próxima possível? Em outras palavras, como devemos formular a FRA para que 𝛽1fique o mais próximo possível do verdadeiro 𝜷 𝟏 e 𝛽2 do verdadeiro 𝜷 𝟐 , mesmo que nunca venhamos a saber quais são os verdadeiros 𝜷 𝟏 e 𝜷 𝟐?  A resposta para essa pergunta ocupará grande parte de nossa atenção no Capítulo 3. Aqui destacamos que é possível desenvolver procedimentos que nos digam como formular a FRA a fim de espelhar FRP o mais fielmente possível. É fascinante considerar que isso pode ser feito mesmo que nunca determinemos a FRP real.
  • 29. Prof.SauloJardim–saulojardim@id.uff.br Anos de Estudo Salário Médio ($/hora) Número de pessoas 6 4,45 3 7 5,77 5 8 5,97 15 9 7,33 12 10 7,31 17 11 5,58 27 12 7,81 218 13 7,83 37 14 11,02 56 15 10,67 13 16 10,83 70 17 13,61 24 18 13,53 31