E4 análise de regressão simples

177 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
177
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
1
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

E4 análise de regressão simples

  1. 1. ESTATÍSTICAECONOMETRIARegressão Linear SimplesRegressão Potencial; Exponencial;HiperbólicaRegressão Linear MúltiplaProf. Ms. Antonio Carlos de Oliveira Capitão
  2. 2. E4 1Prof. Ms. Antonio Carlos de Oliveira CapitãoCONCEITO DE ECONOMETRIA1.- CONCEITOEconometria é oramo do conhecimento humano que aplica a Matemática e a Estatística àTeoria Econômica, objetivando dar-lhe conteúdo empírico.Ela surgiu da seguinte forma: no início, a Teoria Econômica não tinha muitaspreocupações com a parte empírica, mas sim, com a construção de uma arcabouçoteórico, ou seja; a partir das hipóteses que ela estabelecia, procurava tirar proposições quedeveriam explicar o comportamento dos agentes econômicos, sem preocupações com aparte empírica.Mas, duas coisas os teóricos não sabiam:a) quantificar numericamente os parâmetros dos modelos gerados pelas proposições daTeoria Econômica;b) não podiam colocar à prova essas proposições, isto é, não podiam confrontar a suateoria com a realidade.Foi justamente para cobrir esses dois aspectos, que surgiu a Econometria.Exemplos: A Teoria Econômica que a demanda de importações depende do nível deprodução interna e da taxa de câmbio. Além disso, dá o sentido do efeito: dado umaumento na taxa de câmbio (uma desvalorização cambial), as importações deveriamdiminuir (afinal, os produtos estrangeiros tornaram-se mais caros): e, dado um aumentona produção interna, as importações deveriam aumentar (particularmente os de bens decapital e matérias-primas, para suprir o aumento da produção interna).Mas a teoria econômica não dá a magnitude do efeito, isto é, se a produção aumenta 5bilhões; e de quanto deve aumentar as importações, por exemplo. Isso é feito pelaEconometria.Dessa forma a Econometria surgiu com o objetivo de dar conteúdo empírico à TeoriaEconômica, isto é, dar resposta quantitativa às perguntas que os economistas nãopoderiam dar apenas com a Teoria Econômica.
  3. 3. E4 2Prof. Ms. Antonio Carlos de Oliveira Capitão2.- CAMPOSO Estudo da Econometria divide-se em dois grandes campos:a) Modelos de equação única: C = a + bY (Função Cons)b) Modelos de equação simultânea:Y = C + 1 (Condição de equilíbrio)C = a + bY (Função consumo)Como se observa, no modelo de equação simultânea na primeira equação o consumoentra como variável independente e, na segunda, como variável dependente.A estimação dos parâmetros deve serfeita simultâneamente com duas (ou mais) equações.Nosso curso tratará apenas dos modelos de equação única.3.- PRINCIPAL TÉCNICA ECONOMÉTRICAA principal técnica econométrica consiste na Análise de Regressão Linear, que pode serSimples (apenas uma variável explicativa), ou Múltipla (mais de uma variávelexplicativa).4.- EXEMPLOS DE APLICAÇÃOPrimeiramente, a Econometria pode favorecer os valores dos principais parâmetros dePolítica Econômica, como:- propensão marginal a consumir (tirado da função consumo - C = a + bY);- propensão marginal a poupar;- dada uma desvalorização cambial de 5%, qual a diminuição esperada nas importações, eo aumento esperado nas exportações;- efeito quantitativo de um aumento de renda sobre a demanda de moeda (efeitotransação) para com isso ter-se uma idéia definida de qual deve ser o aumento da ofertade moeda da coletividade para suprir aquele aumento de demanda.Em segundo lugar, embora a Econometria tenha nascido para complementar apenas oconhecimento teórico, muitas vezes, a partir da Econometria, é que se criou esseconhecimento. É um exemplo clássico a função tipo Cobb-Douglas, ou ainda a função deprodução CES, ambas nascidas da observação empírica.
  4. 4. E4 3Prof. Ms. Antonio Carlos de Oliveira CapitãoII - REGRESSÃO LINEAR SIMPLES1.- INTRODUÇÃOO economista, muitas vezes, se vê ante a necessidade de descrever e prever ocomportamento de certas variáveis, que serão importantes para sua tomada de decisão.Embora muita coisa possa ser prevista de forma intuitiva, ou através das pesquisas demercado (principalmente quando se refere a curto prazo), é bastante interessante econveniente tentar encontrar fórmulas matemáticas que possam relacionar ocomportamento das variáveis de interesse do administrador, com certo grau de precisão.A previsão através de intuição ou pesquisa de mercado pode resolver satisfatoriamente osproblemas de curto prazo, pois as pessoas informantes podem ter uma certa visão atédeterminado período de tempo, perdendo esta visão à medida que o horizonte do tempoaumenta. O estabelecimento de relações entre variáveis, além de útil a curto prazo,resolve também os problemas de previsão do comportamento de certas variáveis a longoprazo, como se poderá notar ao longo do desenvolvimento desta apostila.A análise de regressão é um método que visa estabelecer relações funcionais entrevariáveis relacionadas por leis estatísticas, isto é, procura encontrar uma função quedescreve da melhor forma possível o comportamento de alguma variável que estamosinteressados em analisar.A análise de regressão é um método que visa estabelecer relações funcionais entrevariáveis relacionadas por leis estatísticas. Para tornar a idéia de regressão linear simplesmais clara, suponha que estamos interessados em analisar e comportamento de umavariável Y, digamos a quantidade do produto”A”, vendida pela empresa “A”. Seriabastante lógico supor que os valores da variável Y sofram a influência de uma série devariáveis tais como:a) o preço do bem “A”, que chamaremos de X1; isto porque à medida em que o preço dobem “A” aumentar, deve ocorrer uma queda na quantidade vendida deste bem (lei dademanda).b) a renda per capita da comunidade, que chamaremos de X2; a medida em que a rendaaumenta, há um número maior de pessoas em condições de adquirir o bem “A”,aumentando consequentemente suas vendas, desde que “A” não seja um bem inferior.c) os gastos com propaganda, que chamaremos de X3; a medida em que os gastos compropaganda aumentam, há uma expansão das vendas do produto “A”, caso a propagandaseja realmente eficiente.
  5. 5. E4 4Prof. Ms. Antonio Carlos de Oliveira Capitãod) poder-se-ia considerar ainda uma série de outras variáveis X4, X5, ........ Xn, taiscomo: gosto dos consumidores, qualidade do produto “A”, qualidade dos prosutosconcorrentes, etc., que podem ser qualificáveis ou não.Portanto, já sabemos que existe uma série de variáveis (X1, X2, ........... Xn) queinfluenciam Y, mas na análise de regressão linear simples, trabalhamos apenas umavariável explicativa X (*). Para superar este problema, isolamos a variável que parece sermais explicativa, desde que seja quantificável e trabalhamos com esta variável. Porexemplo, se estamos interessados em analisar o comportamento das vendas deautomóveis no Brasil, poderemos utilizar a renda per capita como variável explicativa.Neste caso, a quantidade vendida de automóveis é uma função de renda per capita.
  6. 6. E4 5Prof. Ms. Antonio Carlos de Oliveira Capitão2.- O MODELO DE REGRESSÃO LINEAR SIMPLES2.1. - O MODELO VERDADEIROConsideremos o exemplo citado no final do tópico anterior (quantidade vendida deautomóveis (y) como função da renda per capita (x) e suponhamos que estas variáveis secomportem como no gráfico a seguir:1caficamente:Y = α + β X . + Uonde:Y = Y observado = variável dependenteX = variável independente ou variável explicativaα = interceptoβ = declividade ou coeficiente angularU = componente aleatória (ou desvio ou componente errática ou erro)Nesta variável “U” estão contidos os efeitos de todas as variáveis que atuam sobre Y,além de X. Neste exemplo citado, poder-se-ia considerar como contidos em “U”, osefeitos de variáveis como a taxa de juros cobrada no financiamento de automóveis, opreço da gasolina (variáveis quantificáveis), qualidade dos automóveis, gosto dosconsumidores, etc. (variáveis não quantificáveis). A soma de todos estes efeitos é acomponente aleatória “U”. Claramente, estes problemas causam desvios em torno da retaY = α + β X + U, onde:(α + β X) é a parcela livre das causas aleatórias (no exemplo, é a parcela explicada pelarenda per capita).1Na regressão linear múltipla, podemos trabalhar com uma série de variáveis explicativas, mas estemétodo será objeto de estudo mais adiante (parte III).
  7. 7. E4 6Prof. Ms. Antonio Carlos de Oliveira Capitão2.2. O MODELO ESTIMADODado o fato de que sempre trabalhamos com amostra, não podemos conhecer overdadeiro modelo, mas apenas uma estimativa deste; além disso, não conhecemos oresíduo “U”. A partir de uma particular amostra, estaremos obtendo valores estimadosdos parâmetros populacionais α e β.Temos, então y = a + b x, onde:y = y estimadoa = estimativa do interceptob = estimativa da declividadex = variável explicativae = estimativa do erroNOTA: y e x são dados. A partir dessas duas séries, obteremos os valores de a e b.Graficamente:Y = A + BX
  8. 8. E4 7Prof. Ms. Antonio Carlos de Oliveira Capitão3. Os passos da Análise de Regressão Linear Simples 2A especificação do modelo na regressão linear simples consiste de duas fases: seleção devariáveis e especificação da forma funcional.3.1.1. Seleção das variáveis do modeloComo vimos, a regressão linear simples procura estabelecer relações entre variáveis.Sempre que estamos interessados em analisar o comportamento de uma variáveldependente “Y” para estabelecer previsões sobre seu futuro comportamento, precisamosselecionar uma variável independente “X”, que julgamos explicar o máximo possível ocomportamento desta variável “Y”. Exemplos:1º) Se estamos interessados em analisar o comportamento dos custos de uma empresa,precisamos encontrar uma variável que explique as variações de custo, que poderia ser aquantidade produzida. Então C = f (Q), pois à medida que a quantidade produzidaaumenta, devem aumentar os custos de produção.2º) Se queremos analisar a venda de automóveis marda FORD, tipo Corcel, podemosselecionar como variável explicativa o preço relativo do Corcel, isto é, P.Corcel . EntãoP.Concor.Qvc = f (Pcorcel); a medida em que o preço relativo do Corcel aumenta, deve reduzir suaquantidade vendida.3º) Para analisarmos a venda de determinado tipo de brinquedo infantil, poderemosconsiderar como variável explicativa a população que utiliza este tipo de bem, podendoser crianças entre 3 a 10 anos, dependendo do tipo de brinquedo.Às vezes, informações sobre nossa variável explicativa não estão disponíveis por falta deestatísticas. Para solucionar problemas como este, pode ser utilizada uma variável“proxy”, que é uma variável que substitui aproximadamente a que estamos procurando.Por exemplo, podemos medir a renda per capita de uma dada cidade (informação nãodisponível) pela arrecadação de impostos (imposto de renda ou imposto sobre produtosindustrializados) ou ainda pelo consumo de energia elétrica.2O estudo de Regressão Linear Simples está consubstanciado em algumas hipóteses básicas, que serãodiscutidas no capítulo VII.
  9. 9. E4 8Prof. Ms. Antonio Carlos de Oliveira CapitãoPara a seleção das variáveis do modelo, temos que levar em consideração:a) o tamanho da amostra,b) representatividade (a amostra deve ser representativa da população),c) o período escolhido para a amostragem deve ser tal que outras condições que possaminfluir no problema hajam permanecido aproximadamente as mesmas.3.1.2. Especificação de forma funcionalNesta fase do processo, estamos interessados em saber a forma pela qual a variávelindependente exerce influência sobre a variável independente. Uma vez selecionadas asvariáveis, devemos descobrir qual a função que melhor descreve o comportamento de“Y”, quando “X” varia.Nós sabemos que a quantidade vendida do produto “A”, é uma função dos gastos compropaganda efetuadas pela empresa “A”, mas, muitas vezes, não temos condição de saberse esta função é uma reta, uma exponencial ou uma potência.RETA EXPONENCIAL POTÊNCIA
  10. 10. E4 9Prof. Ms. Antonio Carlos de Oliveira CapitãoA especificação da forma funcional entre “Y” e “X” pode ser feita de duas formas. Àsvezes, a teoria subjacente ao desenvolvimento do problema pode sugerir precisamente aforma funcional a ser utilizada, ou então, poderá sugerir a forma funcional a ser utilizada,ou então, poderá sugerir certas condições parciais sobre o intercepto, declividade oucurvatura da função. Neste caso, estaremos partindo de uma especificação “a priori”.Outra forma de especificar a forma funcional entre “X” e “Y” é o emprego do diagramade dispersão. O diagrama de dispersão é a “nuvem” de pontos que obtemos quandocolocamos os pares de valores das variáveis no gráfico. Para cada observação da amostra, teremos tanto um valor de Y observado com um de X observado. Por exemplo,considere o preço do prosuto “A” (preço relativo) e a quantidade vendida deste produtonos anos de 1965 a 1974.
  11. 11. E4 10Prof. Ms. Antonio Carlos de Oliveira CapitãoFÓRMULASREGRESSÃO LINEAR (MODELO LINEAR)Coeficiente de correlação:OBS.: varia entre -1 e 1 inclusive( Σ X . Σ Y)Σ XY - _____________nRXY = ______________________________________________________________________________________________| 2 2 |_ | 2 ( Σ X ) 2 ( Σ Y ) | Σ X - ________ . Σ Y - __________ n nTABELA DE CORRELAÇÃO1---------------> perfeita0,8 -------|0,99 forte OBS.: Pode ser positiva0,6 -------| 0,8 média ou negativa0,3 -------| 0,6 fraca0 ---------| 0,3 fraquíssima0----------| nula_ Σ XMédia de X : X = _____n_ Σ YMédia de Y : Y = ______nEquação de regressão linear (também denominada “função estimada”)Y = a + b x ----------- > variável| independente|----> variáveldependente
  12. 12. E4 11Prof. Ms. Antonio Carlos de Oliveira CapitãoIsolando-se a variável “a” na função acima encontramos:_ _a = y - b x_ _Σ xy - n (x) . (y)b = ________________2 _ 2Σ x - n ( x )ERRO PADRÃO__________________________________| 2 || Σ y - a Σ y - b Σ xySxy = _ | ______________________________ | n - 2 |2Poder Explicativo da Regressão - R2 _ 22 a Σ y + b Σ xy - n yR = _________________________ . 100| Σ y 2 - n y2OBS.: - Varia entre 0 e 100%- As projeções baseadas no modelo é confiável quanto mais se aproxima de 100%.
  13. 13. E4 12Prof. Ms. Antonio Carlos de Oliveira CapitãoFÓRMULA PARA MODELOS NÃO LINEARESPOTÊNCIA EXPONENCIAL HIPÉRBOLEb x + by = a . x y = a . b y = a - __xln y = Uln x = V U = A + b . Vln a = A OBS.: LN = LOGARÍTIMOSNEPERIANOSLOGO : X = VY = U2 2Sequência da Tabela : X, Y, V, U, V , Y , UVΣ UMédia de U = _______nΣ VMédia de V = ______n22 ( Σ U )SUU = Σ U - ________n
  14. 14. E4 13Prof. Ms. Antonio Carlos de Oliveira Capitão22 ( Σ V )SVV = Σ V - _________n( Σ U . Σ V )SUV = Σ UV - ____________n_ _Cálculo de A A = U - b VSUVCálculo de B B = _______SVVOBS.: DEVE-SE MONTAR A FUNÇÃO ESTIMADA (REGRESSÃO) MAISAPROPRIADA AO MODELO ESTUDADO (POTÊNCIA, EXPONENCIAL OUHIPÉRBOLE).22 b . SVV OBS.: VARIA DE 0 A 100% , E QUAN-R = ____________ . 100 TO MAIS O RESULTADO SEAPRO-SUU XIMAR DE 100%, MAIS CONFIÁ-VEL SÃO AS PROJEÇÕES.________________| 2 |Correlação = - | R | _____| 100( Σ X´) . (Σ Y)_ Σ X´ Σ YX´ - ______________X´ = _____ B = nn ____________________________2 2
  15. 15. E4 14Prof. Ms. Antonio Carlos de Oliveira CapitãoΣ X´ = (Σ X´ )_ Σ Y´ ______Y´ = _____ nn _ _A = Y - b . XY = a + b- ____X_ 22 a Σ Y + b Σ X´ Y - n . YR = _________________________ . 1002 _ 2Σ Y - n . Y___________| 2 |X´ Y = - | R | _____| 100EXEMPLO DE REGRESÃO LINEAR
  16. 16. E4 15Prof. Ms. Antonio Carlos de Oliveira CapitãoMétodo dos Mínimos Quadradosx y x2y2x.y825 3,5 680.625 12,25 2.887,5215 1,0 46.225 1,00 215,01.070 4,0 1.144.900 16,00 4.280,0550 2,0 302.500 4,00 1.100,0480 1,0 230.400 1,00 480,0920 3,0 846.400 9,00 2.760,01.350 4,5 1.822.500 20,25 6.075,0325 1,5 105.625 2,25 487,5670 3,0 448.900 9,00 2.010,01.215 5,0 1.476.225 25,00 6.075,0somatório 7.620 28,5 7.104.300 99,75 26.370,0x = 762y = 2,85correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n n(7.620 . 28,5)rxy = 26.370- 10(7.104.300- (58.064.400)).(99,75-812,25)10 10rxy = 0,95 positiva e forteequação de regressão:b = Sxy - n (x).(y) b=26.370 - 10(762).(2,85)Sx2- n (x)27.104.300 - 10(762)2b = 0,003 0,0036a = y - bx a = 2,85 - 0,003 . 762a = 0,5 0,564
  17. 17. E4 16Prof. Ms. Antonio Carlos de Oliveira Capitãoy = a + bxEXEMPLOUma empresa levantou os seguintes dados para avaliar as suas vendas eos gastoscom promoção.x ygastos com vendaspromoção em x2y2x.yem US$1.000 US$milhões1º ano 140 50 19.600 2.500 7.0002º ano 200 57 40.000 3.249 11.4003º ano 238 67 56.644 4.489 15.9464º ano 270 69 72.900 4.761 18.6305º ano 300 77 90.000 5.929 23.1006º ano 400 85 160.000 7.225 34.0007º ano 450 86 202.500 7.396 38.700somatório 1.998 491 641.644 35.549 148.7761 - De quantos milhões seriam as vendas, se a empresa aplicar US$600.000,em promoção?2 - Qual a confiabilidade da projeção, justifique a sua resposta?x = 285,4y = 70,1correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n nrxy = 0,97 positiva e forteequação de regressão:b = Sxy - n (x).(y)Sx2- n (x)2b = 0,1a = y - bx
  18. 18. E4 17Prof. Ms. Antonio Carlos de Oliveira Capitãoa = 41,6erro padrão:Sxy = Sy2- aSy - bSxyn - 2Sxy = 7poder explicativo da regressão:R2= aSy + bSxy - ny2. 100Sy2- ny2R2= 77,8% alto poder explicativoequação de projeção:y = a + bxy = 101,6 milhõesRespostas:1 - As vendas seriam US$ 101,6 milhões.2 - A confiablidade é alta, devido ao alto poder explicativo.EXEMPLO NÚMERO 2A tabela a seguir mostra uma relação entre a nota final deestatísticae o número de horas que os alunos estudaram.y xnotas horas y2x2x.yestudo9 30 81 900 2708 25 64 625 2007 20 49 400 1406 15 36 225 905 14 25 196 704 14 16 196 563 10 9 100 302 5 4 25 101 3 1 9 3somatório 45 136 285 2.676 869Pede-se:
  19. 19. E4 18Prof. Ms. Antonio Carlos de Oliveira Capitão1 - Existe relação entre as duas variáveis acima? Justifique.2 - Identifique a variável explicativa e analise a tabela pelo métododosmínimos quadrados.3 - Analise a confiabilidade do modelo para projeção.4 - Quantas horas o aluno precisa estudar para tirar anota:a - 10b - 5,5c - 0correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n nrxy = 0,98 positiva e fortemédia:x = 15,1y = 5,0equação de regressão linear:b = Sxy - n (x).(y)Sx2- n (x)2b = 0,3a = y - bxa = 0,5y = a + bxpara nota 10 x= 31,7para nota 5,5 x= 16,7para nota 0 x= -1,7erro padrão:Sxy = Sy2- aSy - bSxyn - 2Sxy = 0,5
  20. 20. E4 19Prof. Ms. Antonio Carlos de Oliveira Capitãopoder explicativo da regressão:R2= aSy + bSxy - ny2. 100Sy2- ny2R2= 97,0% alto poder explicativoRespostas:1 - Existe, pois a correlação é positiva e forte.2 - A nota depende das horas, portanto a hora é a variávelexplicativa.3 - A confiabilidade é alta, devido ao alto poder explicativo.4 - Para tirar:nota 10 = 31,7 horasnota 5,5 = 16,7 horasnota 0 = -1,7 horasExercício:Importação brasileira de matéria-prima de 88 a 94 (fonte: Ordem dosEconomistas)x yano quantidade x2y2x.y(ton)1988 1 50 1 2.500 501989 2 47 4 2.209 941990 3 35 9 1.225 1051991 4 30 16 900 1201992 5 24 25 576 1201993 6 10 36 100 60
  21. 21. E4 20Prof. Ms. Antonio Carlos de Oliveira Capitão1994 7 16 49 256 112somatório 28 212 140 7.766 661Informe a projeção para 95 e 96x = 4,0y = 30,3correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n nrxy = -0,96 negativa e forteequação de regressão:b = Sxy - n (x).(y)Sx2- n (x)2b = -6,7a = y - bxa = 57,1erro padrão:Sxy = Sy2- aSy - bSxyn - 2Sxy = 4poder explicativo da regressão:R2= aSy + bSxy - ny2. 100Sy2- ny2
  22. 22. E4 21Prof. Ms. Antonio Carlos de Oliveira CapitãoR2= 93,3% alto poder explicativoequação de projeção:y = a + bxpara 95 y = 3,5para 96 y = -3,2EXERCÍCIORelação entre horas contínuas trabalhadas e quantidade demicrocomputadorescom defeito de montagem (fonte: Hardzon)x yquantidadehoras de micros x2y2x.yc/defeito18 9 324 81 16212 8 144 64 9610 7 100 49 708 6 64 36 486 5 36 25 305 4 25 16 204 3 16 9 12somatório 63 42 709 280 438Faça projeção para: 20 horas15 horas7 horasx = 9,0y = 6,0correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n n
  23. 23. E4 22Prof. Ms. Antonio Carlos de Oliveira Capitãorxy = 0,95 positiva e forteequação de regressão:b = Sxy - n (x).(y)Sx2- n (x)2b = 0,4a = y - bxa = 2,4erro padrão:Sxy = Sy2- aSy - bSxyn - 2Sxy = 1poder explicativo da regressão:R2= aSy + bSxy - ny2. 100Sy2- ny2R2= 85,7% alto poder explicativoequação de projeção:y = a + bxpara 20 horas ====> 10 micros c/defeitopara 15 horas ====> 8 micros c/defeitopara 7 horas =====> 5 micros c/defeito
  24. 24. E4 23Prof. Ms. Antonio Carlos de Oliveira CapitãoREGRESSÃO LINEAR MÚLTIPLAA análise de Regressão Linear Múltipla consiste, na realidade, numa extensão da matériadesenvolvida na primeira parte do curso de “Estatística Aplicada à Administração”, qualseja, a Regressão Linear Simples. Visto que as idéias e conceitos a serem desenvolvidosno decorrer do presente estudo se assemelham com a análise de Regressão LinearSimples, procurar-se-á, na medida do possível, relacionar as duas análises.A idéia central da análise de Regressão Linear Simples era a de encontrar uma função(estimada) que descrevesse (de forma mais perfeita possível) o comportamento de umavariável que estivéssemos interessados em analisar. Para estimarmos esta função,selecionávamos uma variável explicativa (X), a quela que julgássemos explicar omáximo possível o comportamento da variável independente (Y), a ser analisada.No caso da Regressão Linear Múltipla, a diferença fundamental reside no número devariáveis explicativas, que agora não fica limitada a apenas uma, mas podendo expandireste número para quantas variáveis explicativas forem necessárias.No desenvolvimento de nosso curso, utilizaremos o modelo de Regressão LinearMúltipla com “DUAS” variáveis explicativas; a extensão do modelo, a partir daí, paratrês ou mais variáveis explicativas, é imediata, sendo porém, que estes modelos (três oumais variáveis) geralmente são estimados por computador, dada a grande dificuldade emestimalos manualmente.Quando temos três ou mais variáveis denominamos o processo de REGRESSÃOMÚLTIPLA; existem também casos de linearização (Hipérbole, Potência, Exponencial,etc...), porém, nos limitaremos a seguir à “REGRESSÃO LINEAR MÚLTIPLA” comtrês variáveis.Na regressão múltipla não há perfeita multicolinearidade entre os regressores (não existerelação linear perfeita entre as variáveis).Ao tratarmos com três variáveis, deixaremos de usar o gráfico plano (X,Y), para nosreferirmos a um diagrama de dispersão de pontos em três dimensões (X, Y, Z); mas oproblema continua sendo o de encontrar um plano (uma reta na regressão linear simples)que melhor se ajuste, no sentido de menores desvios dos pontos observados.A técnica matemática utilizada é o “Método dos Mínimos Quadrados”, que é umaextensão, de forma geral, da técnica utilizada na Regressão Linear Simples.
  25. 25. E4 24Prof. Ms. Antonio Carlos de Oliveira CapitãoO MODELO VERDADEIRO DE R. L. M.No caso de Regressão Linear Múltipla teremos um plano de regressão, ao invés de umareta. Graficamente:
  26. 26. E4 25Prof. Ms. Antonio Carlos de Oliveira CapitãoMODELO ESTIMADODado o fato que sempre trabalhamos com amostras, não podemos conhecer o verdadeiromodelo, mas apenas uma estimativa deste, além disso não conhecemos o resíduo “Σ” . Apartir de uma particular amostra, procuraremos obter valores estimados dos parâmetrospopulacionais.Temos então: Y = a + b x + b x + ε , onde: b e b # 01 1 2 2 1 2Y = valor estimado de ya = estimativa do interceptob = estimativa de declividade relativa à x (coef. angular)1 1b = estimativa de declividade relativa à x (coef. angular)2 2x , x = variáveis explicativas1 2Σ = resíduo (ERRO)OS PASSOS DA ANÁLISE DE REGRESSÃO MÚLTIPLAO esquema é análogo ao de Regressão Linear Simples.
  27. 27. E4 26Prof. Ms. Antonio Carlos de Oliveira CapitãoFÓRMULASTabela (sequência)2 2 2Y ; X ; X ; X ; X ; Y ; X . X ; Y . X ; Y . X1 2 1 2 1 2 1 2Obs.: Calcular a média aritmética de X , X , Y1 2Σ Y . Σ X1SY = Σ Y . X - ______________1 1nΣ Y . Σ X2SY = Σ Y . X - ______________2 2n2( Σ X )2 1S = Σ X - ___________11 1 nΣ X . Σ X1 2SY = SY = Σ (X . X ) - ______________12 21 1 2n
  28. 28. E4 27Prof. Ms. Antonio Carlos de Oliveira Capitão2( Σ X )2 2S = Σ X - ___________22 2 n22 ( Σ Y )S = Σ Y - ___________yy nSY . S - SY . S1 22 2 12b = _____________________________1 2S . S - ( S )11 22 12SY . S - SY . S2 11 1 21b = _____________________________2 2S . S - ( S )11 22 12_ _ _a = Y - b x - b x1 1 2 2Poder Explicativo :b . SY + b . SY2 1 1 2 2R = _____________________________Syy
  29. 29. E4 28Prof. Ms. Antonio Carlos de Oliveira CapitãoCorrelação:___________| 2 |R = - | Rxy | _____| 100EXERCÍCIOSAnalise as seguintes relações pelo método dos mínimos quadrados :1-) VENDAS (Y) Gastos com tv (x1) Gastos com Jornal (x2)6 3 17 4 215 8 318 8 520 10 823 11 62-) Y X1 X2128 1 100150 2 20078 3 300162 4 400134 5 500175 6 600208 7 700EXEMPLO DE REGRESÃO LINEARMétodo dos Mínimos Quadrados
  30. 30. E4 29Prof. Ms. Antonio Carlos de Oliveira Capitãox y x2y2x.y825 3,5 680.625 12,25 2.887,5215 1,0 46.225 1,00 215,01.070 4,0 1.144.900 16,00 4.280,0550 2,0 302.500 4,00 1.100,0480 1,0 230.400 1,00 480,0920 3,0 846.400 9,00 2.760,01.350 4,5 1.822.500 20,25 6.075,0325 1,5 105.625 2,25 487,5670 3,0 448.900 9,00 2.010,01.215 5,0 1.476.225 25,00 6.075,0somatório 7.620 28,5 7.104.300 99,75 26.370,0x =762y =2,85correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n n(7.620 . 28,5)rxy = 26.370- 10(7.104.300- (58.064.400)).(99,75-812,25)1010
  31. 31. E4 30Prof. Ms. Antonio Carlos de Oliveira Capitãorxy = 0,95 positiva e forteequação de regressão:b = Sxy - n (x).(y)b=26.370 -10(762).(2,85)Sx2- n (x)27.104.300 - 10(762)2b = 0,0030,0036a = y - bx a = 2,85 - 0,003 . 762a = 0,5 0,564y = a + bxEXEMPLOUma empresa levantou os seguintes dados para avaliar as suas vendas e os gastoscom promoção.x ygastos com vendaspromoção em x2y2x.yem US$1.000 US$milhões1º ano 140 50 19.600 2.500 7.0002º ano 200 57 40.000 3.249 11.4003º ano 238 67 56.644 4.489 15.9464º ano 270 69 72.900 4.761 18.630
  32. 32. E4 31Prof. Ms. Antonio Carlos de Oliveira Capitão5º ano 300 77 90.000 5.929 23.1006º ano 400 85 160.000 7.225 34.0007º ano 450 86 202.500 7.396 38.700somatório 1.998 491 641.644 35.549 148.7761 - De quantos milhões seriam as vendas, se a empresa aplicar US$ 600.000,em promoção?2 - Qual a confiabilidade da projeção, justifique a sua resposta?x =285,4y =70,1correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n nrxy = 0,97 positiva e forteequação de regressão:b = Sxy - n (x).(y)Sx2- n (x)2b = 0,1a = y - bx
  33. 33. E4 32Prof. Ms. Antonio Carlos de Oliveira Capitãoa = 41,6erro padrão:Sxy = Sy2- aSy - bSxyn - 2Sxy = 7poder explicativo da regressão:R2= aSy + bSxy - ny2. 100Sy2- ny2R2= 77,8% alto poder explicativoequação de projeção:y = a + bxy =101,6 milhõesRespostas:1 - As vendas seriam US$ 101,6 milhões.2 - A confiablidade é alta, devido ao alto poder explicativo.EXEMPLO NÚMERO 2A tabela a seguir mostra uma relação entre a nota final de estatísticae o número de horas que os alunos estudaram.y x
  34. 34. E4 33Prof. Ms. Antonio Carlos de Oliveira Capitãonotas horas y2x2x.yestudo9 30 81 900 2708 25 64 625 2007 20 49 400 1406 15 36 225 905 14 25 196 704 14 16 196 563 10 9 100 302 5 4 25 101 3 1 9 3somatório 45 136 285 2.676 869Pede-se:1 - Existe relação entre as duas variáveis acima? Justifique.2 - Identifique a variável explicativa e analise a tabela pelo método dosmínimos quadrados.3 - Analise a confiabilidade do modelo para projeção.4 - Quantas horas o aluno precisa estudar para tirar a nota:a - 10b - 5,5c - 0correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n nrxy = 0,98 positiva e fortemédia:x =15,1y =5,0equação de regressão linear:
  35. 35. E4 34Prof. Ms. Antonio Carlos de Oliveira Capitãob = Sxy - n (x).(y)Sx2- n (x)2b = 0,3a = y - bxa = 0,5y = a + bxpara nota 10 x= 31,7para nota5,5x= 16,7para nota 0 x= -1,7erro padrão:Sxy = Sy2- aSy - bSxyn - 2Sxy = 0,5poder explicativo da regressão:R2= aSy + bSxy - ny2. 100Sy2- ny2
  36. 36. E4 35Prof. Ms. Antonio Carlos de Oliveira CapitãoR2= 97,0% alto poder explicativoRespostas:1 - Existe, pois a correlação é positiva e forte.2 - A nota depende das horas, portanto a hora é a variável explicativa.3 - A confiabilidade é alta, devido ao alto poder explicativo.4 - Para tirar:nota 10 = 31,7 horasnota 5,5 = 16,7 horasnota 0 = -1,7 horasExercício:Importação brasileira de matéria-prima de 88 a 94 (fonte: Ordem dos Economistas)x yano quantidade x2y2x.y(ton)1988 1 50 1 2.500 501989 2 47 4 2.209 941990 3 35 9 1.225 1051991 4 30 16 900 1201992 5 24 25 576 1201993 6 10 36 100 60
  37. 37. E4 36Prof. Ms. Antonio Carlos de Oliveira Capitão1994 7 16 49 256 112somatório 28 212 140 7.766 661Informe a projeção para 95 e 96x =4,0y =30,3correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n nrxy = -0,96 negativa e forteequação de regressão:b = Sxy - n (x).(y)Sx2- n (x)2b = -6,7
  38. 38. E4 37Prof. Ms. Antonio Carlos de Oliveira Capitãoa = y - bxa = 57,1erro padrão:Sxy = Sy2- aSy - bSxyn - 2Sxy = 4poder explicativo da regressão:R2= aSy + bSxy - ny2. 100Sy2- ny2R2= 93,3% alto poder explicativoequação de projeção:y = a + bxpara 95y =3,5para 96y =-3,2
  39. 39. E4 38Prof. Ms. Antonio Carlos de Oliveira CapitãoEXERCÍCIORelação entre horas contínuas trabalhadas e quantidade de microcomputadorescom defeito de montagem (fonte: Hardzon)x yquantidadehoras de micros x2y2x.yc/defeito18 9 324 81 16212 8 144 64 9610 7 100 49 708 6 64 36 486 5 36 25 305 4 25 16 204 3 16 9 12somatório 63 42 709 280 438Faça projeção para: 20 horas15 horas7 horasx =9,0y =6,0correlação:(Sx.Sy)rxy = S xy - n(Sx2- (Sx)2).(Sy2-(Sy)2)n nrxy = 0,95 positiva e forte
  40. 40. E4 39Prof. Ms. Antonio Carlos de Oliveira Capitãoequação de regressão:b = Sxy - n (x).(y)Sx2- n (x)2b = 0,4a = y - bxa = 2,4erro padrão:Sxy = Sy2- aSy - bSxyn - 2Sxy = 1poder explicativo da regressão:R2= aSy + bSxy - ny2. 100Sy2- ny2R2= 85,7% alto poder explicativoequação de projeção:y = a + bx
  41. 41. E4 40Prof. Ms. Antonio Carlos de Oliveira Capitãopara 20 horas ====> 10 micros c/defeitopara 15 horas ====> 8 micros c/defeitopara 7 horas =====> 5 micros c/defeito

×