Tópico 4 regressão linear simples 02

1.339 visualizações

Publicada em

Publicada em: Educação
0 comentários
3 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
1.339
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
78
Comentários
0
Gostaram
3
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Tópico 4 regressão linear simples 02

  1. 1. Estatística II Ricardo Bruno N. dos Santos Professor Adjunto da Faculdade de Economia e do PPGE (Economia) UFPA UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS FACULDADE DE ECONOMIA
  2. 2. O Modelo Clássico de Regressão Linear Normal (MCRLN) Até o momento foi verificado como estimar os valores dos 𝛽′ 𝑠 e  para o MRLS. Porém existe uma etapa muito importante, que são os testes de hipóteses. São tais testes que tornam possível a inferência estatística, ou seja, nos dão um grau de “tranquilidade” para afirmar se nossas estimativas da FRA são realmente próximas a FRP. Para que tal aspecto seja válido, devemos considerar uma pressuposição fundamental sobre os resíduos, devemos considerar e provar que os mesmos são normais.
  3. 3. A hipótese de normalidade de 𝒖𝒊 Foi verificado que: Média: 𝐸 𝑢𝑖 = 0 Variância: 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖 2 = 𝐸 𝑢𝑖 2 = 𝜎2 Covariância: 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖 𝑢𝑗 − 𝐸 𝑢𝑗 = 𝐸 𝑢𝑖 𝑢𝑗 = 0 Todas as hipóteses acima podem ser representadas de forma compacta, pelo indicativo que os resíduos possuem uma distribuição normal com média 0 e variância constante: 𝒖𝒊~𝑵 𝟎, 𝝈 𝟐
  4. 4. A hipótese de normalidade de 𝒖𝒊 Por que usar a normalidade: 1) Pelo fato dos resíduos 𝑢𝑖 serem uma influência combinada (sobre a variável independente) de um conjunto de variáveis independentes não incluídas no modelo, porém com pouca influência sobre a variável dependente. A maior parte das distribuições quando apresentam crescimento no seu número de observações tornam-se normais, e como o resíduo representa variáveis não incluídas no modelo, imagina-se que, segundo o TEOREMA DO LIMITE CENTRAL (TLC), a soma de tais variáveis levem a uma distribuição normal.
  5. 5. A hipótese de normalidade de 𝒖𝒊 2) Mesmo não sendo grande o número de variáveis e que as mesmas não sejam independentes, a sua soma pode ainda ser normal. 3) Como os 𝛽′ 𝑠 são funções lineares de 𝑢𝑖, então podemos concluir que os estimadores tendem a uma normal. 4) A facilidade do uso da distribuição normal, por conter apenas dois parâmetros (média e variância), tornou seu uso muito frequente, bem como o direcionamento para vários estudos e resultados baseados nessas pressuposições. 5) Mesmo com uma amostra inferior a 100 observações ainda podemos relaxar a hipótese de normalidade, para tanto, usa-se outras distribuições como a t, F e 2 (qui-quadrado), que possuem o comportamento de uma normal, quando aplicado o TLC.
  6. 6. Propriedade dos estimadores de MQO sobre a hipótese de normalidade Considerando que os resíduos possuem uma distribuição normal, então podemos afirmar sobre os estimadores que: 1) São não viesados 2) Tem variância mínima. COMBINANDO 1 COM 2 TEREMOS ESTIMADORES EFICIENTES 3) São Consistentes; à medida que o tamanho da amostra aumenta indefinidamente, os estimadores convergem para os verdadeiros valores da população. (Ou seja FRA≈FRP).
  7. 7. Propriedade dos estimadores de MQO sobre a hipótese de normalidade 4) 𝛽1 ( que é uma função linear de 𝑢_𝑖 ) apresenta distribuição normal com Média: E 𝛽1 = 𝛽1 Variância: 𝑣𝑎𝑟 𝛽1 : 𝜎𝛽1 2 = 𝑋𝑖 2 𝑛 𝑥 𝑖 2 𝜎2 Ou seja 𝛽1~𝑁 𝛽1, 𝜎𝛽1 2 Pelas propriedades da distribuição normal, a variável Z, que é definida como: 𝑍 = 𝛽1 − 𝛽1 𝜎𝛽1 Que por sua vez segue uma distribuição normal padrão, com média zero e variância =1. 𝑍~𝑁(0,1)
  8. 8. Propriedade dos estimadores de MQO sobre a hipótese de normalidade 5) Como 𝛽2 (sendo uma função linear de 𝑢𝑖) tem distribuição normal com Média: E 𝛽2 = 𝛽2 Variância: 𝑣𝑎𝑟 𝛽2 : 𝜎𝛽2 2 = 𝜎2 𝑥 𝑖 2 Ou seja 𝛽2~𝑁 𝛽2, 𝜎𝛽2 2 Pelas propriedades da distribuição normal, a variável Z, que é definida como: 𝑍 = 𝛽2 − 𝛽2 𝜎𝛽2
  9. 9. Propriedade dos estimadores de MQO sobre a hipótese de normalidade Geometricamente podemos representar as distribuições dos estimadores a partir dos seguintes gráficos:
  10. 10. Propriedade dos estimadores de MQO sobre a hipótese de normalidade 6) (n-2)( 𝜎2/𝜎2 ) segue a distribuição de 2 (qui- quadrado) com (n-2) graus de liberdade. Essa informação nos ajuda a fazer inferência sobre o verdadeira 𝜎2 com base no seu valor estimado. 7) A distribuição dos ’s são independentes de 𝜎2 . 8) 𝛽1 e 𝛽2 possuem a variância mínima dentro das classes dos estimadores não viesados, sejam lineares ou não.
  11. 11. MRLS: Estimação de intervalo e testes de hipóteses A principal ideia da estimação de intervalos lembremos do resultado da Propensão Marginal a Consumir encontrada a partir dos dados da Tabela 3.2. O valor de 𝛽2 = 0,51, que representa uma única estimativa (pontual) do valor desconhecido da população 𝛽2. A pergunta é: Até que ponto essa estimativa é CONFIÁVEL? Em Estatística, a confiabilidade de um estimador pontual é medida por seu ERRO PADRÃO. Em vez de considerar apenas a estimativa pontual, podemos construir um intervalo em torno de um estimador pontual, de dois ou três erros padrão de cada lado do estimador pontual, de modo que este intervalo tenha, por exemplo, 95% DE PROBABILIDADE DE INCLUIR O VERDADEIRO VALOR DO PARÂMETRO. Essa é a ideia que está por trás da estimação de intervalo.
  12. 12. MRLS: Estimação de intervalo e testes de hipóteses Um exemplo disso seria supormos que temos dois números positivos  e , sendo  situado entre 0 e 1, o elemento a ser encontrado é de que a probabilidade de que o intervalo aleatório ( 𝛽2 − 𝛿, 𝛽2 + 𝛿) contenha o verdadeiro valor de 𝛽2 seja de 1 − 𝛼. Assim: Pr 𝛽2 − 𝛿 ≤ 𝛽2 ≤ 𝛽2 + 𝛿 = 1 − 𝛼, onde: 1 − 𝛼: Coeficiente de confiança; (se =5%, teremos 95% de confiança de estar corretos). : Nível de significância. 𝛽2 − 𝛿: Limite inferior de confiança 𝛽2 + 𝛿: Limite superior de confiança.
  13. 13. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝜷 𝟏 e 𝜷 𝟐 Verificamos que, dada a hipótese de normalidade dos resíduos, teríamos: 𝑍 = 𝛽2 − 𝛽2 𝑒𝑝 𝛽2 = 𝛽2 − 𝛽2 𝑥𝑖 2 𝜎 Assim poderíamos afirmar que: 𝑡 = 𝛽2 − 𝛽2 𝑒𝑝 𝛽2 = 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 − 𝑃𝑎𝑟â𝑚𝑒𝑡𝑟𝑜 𝑒𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 𝑑𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟
  14. 14. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝜷 𝟏 e 𝜷 𝟐 Nesse caso, em vez de usar uma distribuição normal, podemos utilizar a distribuição t para estabelecer um intervalo de confiança para 𝛽2 como abaixo: Pr(−𝑡 𝛼/2 ≤ 𝑡 ≤ 𝑡 𝛼/2)= 1 − 𝛼 Assim teríamos: Pr(−𝑡 𝛼/2 ≤ 𝛽2−𝛽2 𝑒𝑝 𝛽2 ≤ 𝑡 𝛼/2)= 1 − 𝛼 Que reorganizado nos fornece: Pr[ 𝛽2 − 𝑡 𝛼 2 𝑒𝑝 𝛽2 ≤ 𝛽2 ≤ 𝛽2 + 𝑡 𝛼 2 𝑒𝑝 𝛽2 ] = 1 − 𝛼 Assim o intervalo será: 𝛽2 ± 𝑡 𝛼 2 𝑒𝑝 𝛽2
  15. 15. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝜷 𝟏 e 𝜷 𝟐 A linha de raciocínio anterior também vale para 𝛽1, logo: Pr[ 𝛽1 − 𝑡 𝛼 2 𝑒𝑝 𝛽1 ≤ 𝛽1 ≤ 𝛽1 + 𝑡 𝛼 2 𝑒𝑝 𝛽1 ] = 1 − 𝛼 Assim o intervalo será: 𝛽1 ± 𝑡 𝛼 2 𝑒𝑝 𝛽1
  16. 16. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝜷 𝟏 e 𝜷 𝟐 Vamos consideras os valores encontrados para a estimativa da PMC da tabela 3.2. Considere os valores de 𝛽2 = 0,509, como temos 10 observações, então o grau de liberdade será 8. Supondo que =5%, a tabela t mostra para 8 graus de liberdade o valor crítico de 𝑡 𝛼/2 = 2,306 Substituindo os valores até então encontrados na equação abaixo teremos: 𝛽2 ± 𝑡 𝛼 2 𝑒𝑝 𝛽2 = 0,509 + 2,306 ∗ 0,0357428 = 0,5914 = 0,509 − 2,306 ∗ 0,0357428 = 0,4266 Logo: 0,4266 ≤ 𝛽2 ≤ 0,5914
  17. 17. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝜷 𝟏 e 𝜷 𝟐 Assim, com uma confiança de 95% de estarmos certos, ou seja, em 95 de 100 casos, os intervalos de 𝛽2 conterão o verdadeiro 𝛽2. Para o 𝛽1 teremos: = 24,45 + 2,306 ∗ 6,41 = 39,23 = 24,45 − 2,306 ∗ 6,41 = 9,67 Logo: 9,67 ≤ 𝛽1 ≤ 39,23
  18. 18. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝝈 𝟐 . O intervalo de confiança para a variância dos resíduos estará pautado em um distribuição do tipo qui-quadrado onde: 2 = 𝑛 − 2 𝜎2 𝜎2 Que pode ser utilizada para estabelecer o intervalo de confiança, onde: Pr 1− 𝛼 2 2 ≤ 2 ≤  𝛼 2 2 = 1 − 𝛼 onde o valor da distribuição 2 no meio dessa dupla desigualdade é dado pela 1ª Equação acima onde 1−𝛼/2 2 e  𝛼/2 2 são dois valores de 2 (os valores críticos de 2) obtidos na tabela de qui-quadrado para n-2 gl, de modo que eles excluem 100(/2)% das áreas caudais da distribuição de qui-quadrado.
  19. 19. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝝈 𝟐 Consultado a tabela qui-quadrado para (n-2) graus de liberdade (8), teremos o seguintes valores:0,025 2 = 17,5346 e 0,975 2 = 2,1797. Tais valores mostram que a probabilidade de que um valor 2 superior a 17,5346 e de 2,5% e o de 2,1797 é de 97,5%. Portanto, o intervalo entre esses dois valores é o intervalo de confiança de 95% para 2 , como o gráfico a seguir, mas antes, verifiquemos como se consulta o valor na tabela qui-quadrado. No slide seguinte temos a apresentação do gráfico da 2.
  20. 20. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝝈 𝟐
  21. 21. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝝈 𝟐 Se substituirmos o 2 = 𝑛 − 2 𝜎2 𝜎2 em Pr 1− 𝛼 2 2 ≤
  22. 22. MRLS: Estimação de intervalo e testes de hipóteses Intervalos de confiança para 𝝈 𝟐 8 ∗ 42,1591 2,1797 = 154,734 8 ∗ 42,1591 17,5346 = 19,2347 Assim teremos: 19,23 ≤ 𝜎2 ≤ 154,73 Ou seja, se estabelecermos limites de confiança de 95% em 𝜎2 e se mantivermos a priori que esses limites incluem o verdadeiro 𝜎2, estaremos certos 95% das vezes a longo prazo.
  23. 23. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses A pergunto é: Quais as hipóteses devem ser feitas sobre os estimadores ’s? Devemos saber se esses estimadores são ou não diferentes de zero, ou seja, estabelecemos a hipótese nula e alternativa referente a um valor específico dos betas, a referência então será dizer que os betas são não significativos, ou seja, serão zero. 𝐻0: 𝛽 = 0 𝐻1: 𝛽 ≠ 0 O 𝛽2 observado é compatível com 𝐻0? Para respondermos a essa pergunta, voltemos ao intervalo (0,4266;0,5914) conterão, com 95% de probabilidade de não cometer o erro tipo I, o verdadeiro valor de 𝛽2 . Quando um teste especifica uma diferença ela pode ser para mais ou para menos, o que indica dois pontos distintos, esse é um tipo de TESTE BICAULDAL ou BILATERAL.
  24. 24. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses Consequentemente, a longo prazo (em repetidas amostras), esses intervalos proporcionam faixas ou limites dentro dos quais o verdadeiro 𝛽2 pode situar-se com um coeficiente de confiança de, por exemplo, 95%. O intervalo de confiança oferece um conjunto de hipóteses nulas plausíveis. Se 𝛽2 sob 𝐻0 cair no intervalo de confiança de 100(1-)%, NÃO REJEITAREMOS a hipótese nula; se estiver situada fora desse intervalo, poderemos rejeita-la. Podemos ver essa faixa no gráfico a seguir.
  25. 25. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses Teste UNILATERAL ou UNICAUDAL: quando se tem certeza de que o coeficiente terá um determinado comportamento, por exemplo, sabemos que o coeficiente de inclinação da regressão de demanda do consumidor é negativo, portanto podemos estabelecer uma hipótese sobre 𝛽2 onde: 𝐻0: 𝛽2 < 0 Essa é uma forte expectativa teórica (a priori) sobre o comportamento da demanda do consumidor, que indica que aumentos dos preços provocam queda na quantidade demandada de um bem.
  26. 26. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste Apesar de válida, a abordagem do intervalo de confiança é demorada e visualmente complicada de se mostrar, uma forma rápida e eficiente de se testar hipóteses estatísticas são pelos testes de significância. O mais conhecido e comum teste é o teste t de student. Considerando a premissa da normalidade verificou-se que: 𝑡 = 𝛽2 − 𝛽2 𝑒𝑝 𝛽2
  27. 27. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste O teste é feito se avaliando o valor calculado pela função anterior comparado com o valor tabelado, se o valor calculado for maior que o tabelado, teremos a rejeição da hipótese nula H0. Vamos mostrar através de um infográfico o cálculo da estatística t e sua comparação com o valor tabelado para o modelo de regressão da propensão marginal a consumir: A hipótese aqui testada é a de que Beta 2 é igual a zero, assim: 𝐻 𝑜: 𝛽2 = 0, ou seja, trata-se de uma hipótese bicaudal. Vejamos o procedimento de rejeição ou não de tal hipótese:
  28. 28. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste 1º Qual a Hipótese? 𝐻0: 𝛽2 = 0 O valor do t calculado é: 𝑡 𝑐𝑎𝑙𝑐 = 0,51 0,0357 = 14,29 O 𝑡𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 é Para 10% = 1,86 Para 5% = 2,306 Para 1%= 3,355 A CONCLUSÃO: Como o valor de t Tabelado é Maior que o Calculado, rejeitamos a Hipótese nula 𝐻0 de que o 𝛽2 = 0
  29. 29. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste A hipótese pode ser feita também sobre algum tipo de restrição, vamos usar um exemplo hipotético, imagine que o coeficiente 𝛽2 de uma função seja = 2,3; e seu erro padrão seja de 0,32, assim teríamos 𝑡 = 2,3 0,32 = 7,19, que é significativa, ou seja, rejeita-se H0. Agora imagine que exista uma restrição para essa variável afirmando que na verdade ela é igual a 0,5, assim nossa hipótese mudaria para, considere n=13 e =5%: 𝐻0: 𝛽2 = 0,5; originando a seguinte restrição: 𝐻0: 𝛽2 − 0,5 = 0
  30. 30. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste Dessa forma passamos a testar: 𝑡 = 𝛽2 − 0,5 𝑒𝑝 𝛽2 Assim teríamos: 𝑡 = 2,3 − 0,5 0,32 = 5,625 Pelo resultado acima ainda rejeitamos H0, logo, podemos concluir que 𝛽2 ≠ 0,5. O gráfico para uma situação como essa seria algo do tipo:
  31. 31. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste
  32. 32. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste
  33. 33. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste Vamos considerar agora o mesmo exemplo, porém na ótica do teste unilateral para fixarmos tal aplicação e conceito. Vamos supor agora que a inclinação seja maior que 0,5, ou seja, a hipótese a ser testada agora é: 𝐻0: 𝛽2 ≤ 0,5 𝐻1: 𝛽2 > 0,5 Ou seja, a hipótese agora remete apenas a um lado da distribuição, agora ela possui característica unilateral. O procedimento para o cálculo de tal hipótese ainda permanece o mesmo, a única coisa que muda será o valor correspondente do , considerando o nível de 5%, teremos:
  34. 34. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste Teste de significância para o 𝝈 𝟐. Vamos tomar como exemplo o valor calculado para a variância dos resíduos estimado no modelo da PMC. 𝜎2 = 42,1591 e o grau de liberdade 8. Se postularmos que 𝐻0: 𝜎2 = 85 e 𝐻1: 𝜎2 ≠ 85 a equação envolvendo o qui- quadrado 𝑛 − 2 𝜎2 𝜎2 = 2 nos fornece o teste estatístico para 𝐻0. Substituindo os valores nos parâmetros da fórmula do qui-quadrado, verificamos que, para 𝐻0 , 2 = 3,97 . Se assumirmos =5%, os valores críticos de 2 serão 2,1797 e 17,5346. Como o valor do 2 = 3,97 encontra-se dentro deste intervalo não rejeitamos, portanto, a hipótese nula.
  35. 35. MRLS: Estimação de intervalo e testes de hipóteses Os testes de hipóteses: a significância do teste Para avaliar o teste qui-quadrado sobre a variância dos resíduos devemos considerar:
  36. 36. MRLS: Análise de Regressão e Análise de Variância Verificamos que 𝑦𝑖 2 = 𝑦𝑖 2 + 𝑢𝑖 2 = 𝛽2 2 𝑥𝑖 2 + 𝑢𝑖 2 Ou seja, SQT=SQE+SQR Todos esses resultados podem ser organizados em uma tabela, que é a tabela da ANOVA.
  37. 37. MRLS: Análise de Regressão e Análise de Variância
  38. 38. MRLS: Análise de Regressão e Análise de Variância Se preenchermos a tabela anterior com os dados obtidos no exemplo da seção 3.6, poderemos encontrar uma importante estatística do MRLS que é a estatística F, assim, teremos os seguintes resultados:
  39. 39. Aplicação da análise da regressão: o problema da previsão Um dos últimos procedimentos do MRLS é verificar a sua previsão, iremos trabalhar nesse caso com a previsão média e individual, tendo em vista que são as mais comuns de serem utilizadas, os procedimentos para tal uso necessitam que o aluno tenha fixado os conceitos vistos anteriormente sobre variância, erro padrão e intervalo de confiança. Vamos então utilizar o mesmo exemplo da propensão marginal a consumir da seção 3.6, onde o seguinte modelo havia sido estimado: 𝑌0 = 24,4545 + 0,5091𝑋0 O termo sublinhado zero indica que estamos na etapa inicial da previsão, ou seja, é o modelo cru. Agora imagine que queiramos estimar o valor de Y quando X=20, assim:
  40. 40. Aplicação da análise da regressão: o problema da previsão 𝑌20 = 24,4545 + 0,5091 20 = 34,6365 Algo interessante a ser notado nesse resultado é que, quando a renda for 20 unidades monetárias, o consumo será de 34,6365 unidades. Mas em termos de impactos teríamos que analisar da seguinte forma: um aumento de 20 unidades monetárias gera um aumento no consumo de 34,6365- 24,4545= 10,182 unidades. Temos que subtrair o intercepto para fazer a análise de impacto, pois este se trata de um consumo médio quando não existe variação, ou seja, o mesmo não pode ser computado.
  41. 41. Aplicação da análise da regressão: o problema da previsão Para trabalhar essa estimativa em termos de intervado de confiança, teríamos que estimar a variância de Y, ou seja, 𝑣𝑎𝑟 𝑌0 , onde, considerando uma distribuição normal, teremos: 𝑣𝑎𝑟 𝑌0 = 𝜎2 1 𝑛 + 𝑋0 − 𝑋 2 𝑥𝑖 2 Claro que a 𝜎2 deve ser substituída pelo seu valor estimado, ou seja, 𝜎2, o que nos gera: 𝑡 = 𝑌0 − 𝛽1 + 𝛽2 𝑋0 𝑒𝑝 𝑌0
  42. 42. Aplicação da análise da regressão: o problema da previsão Com isso, o intervalo de confiança a ser formado será o: Pr 𝛽1 + 𝛽2 𝑋0 − 𝑡 𝛼 2 𝑒𝑝 𝑌0 ≤ 𝛽1 + 𝛽2 𝑋0 ≤ 𝛽1 + 𝛽2 𝑋0 + 𝑡 𝛼 2 𝑒𝑝 𝑌0 = 1 − 𝛼 Em que o 𝑒𝑝 𝑌0 = 𝑣𝑎𝑟( 𝑌0) Já verificamos que: 𝜎2 = 𝑢𝑖 2 𝑛 − 2 = 337.2727 8 = 42,1591 𝜎 = 6,493 𝑥𝑖 2 = 33000 𝑋 = 170
  43. 43. Aplicação da análise da regressão: o problema da previsão Assim temos: 𝑣𝑎𝑟 𝑌0 = 42,1591 1 10 + 20 − 170 2 33000 = 32,96 ep 𝑌0 = 5,74 Com isso podemos calcular o intervalo de confiança para a projeção que será de: 34,6365 − 2,306 5,74 ≤ 𝐸 𝑌0 𝑋 = 20 ≤ 34,6365 + 2,306(5,74) 21,397 ≤ 𝐸 𝑌0 𝑋 = 20 ≤ 47,876
  44. 44. Aplicação da análise da regressão: o problema da previsão Para a individual teremos o seguinte comportamento no cálculo da variância de Y 𝑣𝑎𝑟 𝑌0 − 𝑌0 = 𝐸 𝑌0 − 𝑌0 2 = 𝜎2 1 + 1 𝑛 + 𝑋0 − 𝑋 2 𝑥𝑖 2 E t será 𝑡 = 𝑌0 − 𝑌0 𝑒𝑝 𝑌0 − 𝑌0 No caso do nosso exemplo verificamos que sua variância pontual será de 75,12, assim o intervalo de confiança para 95% para 𝑌0 correspondente a 𝑋0 = 20 é: (14,65 ≤ 𝑌0|𝑋0 = 20 ≤ 54,623)
  45. 45. Aplicação da análise da regressão: o problema da previsão O objetivo é que no final tenhamos um gráfico semelhante ao que se encontra a seguir:
  46. 46. Aplicação da análise da regressão: Teste de Normalidade Um dos principais pressupostos dentro do Modelo de Regressão linear é a de que os resíduos sejam normais. Logo após a estimação do modelo de regressão o teste de normalidade pode ser feito, ou pode ser feito especificamente, com a variável em questão, nesse caso, os resíduos. O teste mais comum de normalidade é o Jarque-Bera (JB). Ele faz o calculo baseado na assimetria (S) e na curtose (K) das variáveis. As características das distribuições normais são de S=0 e K=3.
  47. 47. Aplicação da análise da regressão: Teste de Normalidade O teste de JB é dado pela seguinte expressão: 𝐽𝐵 = 𝑛 𝑆2 6 + 𝐾 − 3 2 24 Note que se o pressuposto da normalidade seja atendido S=0 e K=3, o valor do JB será zero, logo estamos testando na estatística de Jarque-Bera a seguinte hipótese: 𝐻0: 𝑁𝑜𝑟𝑚𝑎𝑙𝑖𝑑𝑎𝑑𝑒 Portanto, o principal resultado da estatística JB é não rejeitar a hipótese nula. Vamos ao exemplo da seção 3.6 (PMC) no Gretl.
  48. 48. FIM DO TÓPICO 4

×