O documento discute conceitos básicos de regressão linear com duas variáveis, incluindo: (1) a função de regressão populacional que representa a relação entre a variável dependente e independente na população, (2) como estimar esta função usando uma amostra, resultando na função de regressão amostral, (3) como a regressão amostral é uma aproximação imprecisa da regressão populacional devido a variações amostrais.
1) O documento discute o conceito de inferência estatística e como ela pode ser usada para estimar parâmetros populacionais a partir de amostras.
2) A média é apresentada como um modelo estatístico comum e como sua precisão pode ser medida pelo desvio padrão.
3) A correlação é introduzida como uma medida do relacionamento linear entre variáveis e como ela pode ser representada graficamente através de diagramas de dispersão.
1. O documento discute análise de correlação e regressão, técnicas estatísticas usadas para medir o relacionamento entre variáveis.
2. A correlação mede o grau de relacionamento entre variáveis, enquanto a regressão estima uma equação matemática que descreve a relação entre variáveis.
3. Os dados usados podem ser de séries temporais ou seção transversal e combinações delas, coletados de amostras sobre variáveis econômicas, financeiras ou contábeis relacionadas ao agronegócio.
Este documento discute conceitos e métodos de análise de regressão linear. Ele explica o que é regressão simples e múltipla, como interpretar os coeficientes de regressão, e métodos para selecionar variáveis preditoras, como entrada forçada, hierárquica e passo a passo. Também aborda diagnósticos para identificar valores atípicos e casos influentes e a importância de validar se um modelo pode ser generalizado.
O documento discute conceitos básicos de regressão linear, incluindo função de regressão populacional, função de regressão amostral, método dos mínimos quadrados ordinários e suas propriedades estatísticas. O método dos mínimos quadrados ordinários escolhe os estimadores de modo a minimizar a soma dos quadrados dos resíduos, tornando a aproximação entre a função de regressão amostral e a populacional o mais próxima possível.
O documento discute o modelo de regressão linear simples. Explica que a regressão analisa a dependência entre uma variável dependente e uma ou mais variáveis explicativas, estimando o valor médio da primeira em termos dos valores das segundas. Também apresenta o método dos mínimos quadrados ordinários para estimar os parâmetros da regressão linear simples a partir de uma amostra, de modo a aproximar a regressão amostral da regressão populacional.
Este documento apresenta uma introdução à análise de regressão. Discute conceitos como natureza da regressão, conceitos de regressão para população e amostra, estimação e hipóteses. Também fornece exemplos ilustrativos sobre regressão linear.
1) O documento discute o conceito de inferência estatística e como ela pode ser usada para estimar parâmetros populacionais a partir de amostras.
2) A média é apresentada como um modelo estatístico comum e como sua precisão pode ser medida pelo desvio padrão.
3) A correlação é introduzida como uma medida do relacionamento linear entre variáveis e como ela pode ser representada graficamente através de diagramas de dispersão.
1. O documento discute análise de correlação e regressão, técnicas estatísticas usadas para medir o relacionamento entre variáveis.
2. A correlação mede o grau de relacionamento entre variáveis, enquanto a regressão estima uma equação matemática que descreve a relação entre variáveis.
3. Os dados usados podem ser de séries temporais ou seção transversal e combinações delas, coletados de amostras sobre variáveis econômicas, financeiras ou contábeis relacionadas ao agronegócio.
Este documento discute conceitos e métodos de análise de regressão linear. Ele explica o que é regressão simples e múltipla, como interpretar os coeficientes de regressão, e métodos para selecionar variáveis preditoras, como entrada forçada, hierárquica e passo a passo. Também aborda diagnósticos para identificar valores atípicos e casos influentes e a importância de validar se um modelo pode ser generalizado.
O documento discute conceitos básicos de regressão linear, incluindo função de regressão populacional, função de regressão amostral, método dos mínimos quadrados ordinários e suas propriedades estatísticas. O método dos mínimos quadrados ordinários escolhe os estimadores de modo a minimizar a soma dos quadrados dos resíduos, tornando a aproximação entre a função de regressão amostral e a populacional o mais próxima possível.
O documento discute o modelo de regressão linear simples. Explica que a regressão analisa a dependência entre uma variável dependente e uma ou mais variáveis explicativas, estimando o valor médio da primeira em termos dos valores das segundas. Também apresenta o método dos mínimos quadrados ordinários para estimar os parâmetros da regressão linear simples a partir de uma amostra, de modo a aproximar a regressão amostral da regressão populacional.
Este documento apresenta uma introdução à análise de regressão. Discute conceitos como natureza da regressão, conceitos de regressão para população e amostra, estimação e hipóteses. Também fornece exemplos ilustrativos sobre regressão linear.
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
O documento descreve um estudo para prever o índice Ibovespa através de um modelo de regressão linear múltipla utilizando variáveis como outros índices de bolsa e indicadores de mercado. Dois modelos são propostos e seus resultados são comparados para verificar qual melhor explica o comportamento do Ibovespa.
1) O documento descreve um modelo de regressão linear simples, apresentando a equação, o método dos mínimos quadrados ordinários para estimar os parâmetros, e os testes de significância dos parâmetros e da regressão como um todo.
2) É apresentado um exemplo numérico ilustrando os cálculos para estimar a reta de regressão e os testes.
3) A regressão é validada através dos testes F e t, indicando que os parâmetros são estatisticamente significativos.
1) A regressão linear é uma técnica estatística amplamente utilizada para modelar a relação entre uma variável dependente e uma ou mais variáveis independentes.
2) O objetivo da modelagem é simplificar problemas complexos e focar na essência da questão.
3) A análise de regressão linear envolve explorar os dados, desenvolver um modelo teórico, identificar o melhor modelo de acordo com os dados e validar o modelo.
Este documento discute o relaxamento das hipóteses da regressão linear clássica, especificamente multicolinearidade, heterocedasticidade e autocorrelação. O autor analisa cada uma dessas violações das hipóteses e apresenta métodos para detectá-las e corrigi-las.
Este documento descreve os conceitos e procedimentos da análise fatorial, incluindo a extração de fatores, critérios para determinar o número de fatores e a interpretação dos mesmos. A análise fatorial é uma técnica estatística que resume um conjunto de variáveis em fatores subjacentes com menor perda de informação.
1) O documento discute o problema da estimação no modelo de regressão múltipla, onde a variável dependente é explicada por múltiplas variáveis independentes.
2) São apresentadas as hipóteses do modelo de regressão múltipla e o método dos mínimos quadrados ordinários para estimar os parâmetros do modelo.
3) Discutem-se também as propriedades dos estimadores, como serem não enviesados, consistentes e eficientes.
Aula de Métodos e Técnicas de Análise da Informação para Planejamento, julho de 2017, UFABC
Apresentação disponível em: https://youtu.be/cQ8ZfzL3SfI
Bases de dados disponíveis em:https://app.box.com/s/4yl70hj73c9mqyh1jb0l8skics4xf8i1
1) O documento discute correlação linear e o coeficiente de correlação de Pearson (r), que mede a intensidade da associação entre duas variáveis quantitativas.
2) r pode variar de -1 a +1, sendo valores negativos indicam correlação inversa e positivos correlação direta. Valores próximos a zero indicam fraca correlação.
3) O documento também apresenta o coeficiente de determinação (r2) e discute pressupostos e limitações do uso de r para avaliar correlação.
O documento discute vários modelos de regressão linear, incluindo regressão múltipla, modelos log-log, log-lin e lin-log. Também aborda propriedades desses modelos como colinearidade e interpretação dos coeficientes.
O documento discute o modelo de regressão linear clássico, incluindo a hipótese de normalidade dos resíduos, propriedades dos estimadores sob essa hipótese, estimação de intervalos de confiança para os parâmetros β1, β2 e σ2, e testes de hipóteses. Explica como construir intervalos de confiança para os parâmetros usando a distribuição t e qui-quadrado e como consultar esses valores críticos na tabela.
1) VAR e VECM são modelos utilizados para analisar séries temporais econômicas inter-relacionadas, capturando suas interdependências e relações de curto e longo prazo.
2) VAR considera todas as variáveis como endógenas e igualmente influentes, enquanto VECM captura relações de longo prazo quando as variáveis são cointegradas.
3) A escolha entre VAR e VECM depende de testes de raiz unitária e cointegração para verificar a estacionariedade das séries e presença de uma
Modelo de regressão linear: aspectos teóricos e computacionais Rodrigo Rodrigues
Este documento apresenta os conceitos e técnicas de regressão linear simples utilizando o software estatístico R. A análise é aplicada a um conjunto de dados sobre tartarugas nas ilhas Galápagos e estima a relação entre número de espécies e espécies endêmicas. Os resultados são analisados por meio de gráficos, testes estatísticos e intervalos de confiança para avaliar a significância do modelo.
Este documento descreve uma disciplina de pós-graduação em estatística multivariada. A disciplina ensina técnicas como regressão linear múltipla, análise de componentes principais e análise discriminante. Os alunos aprenderão a modelar fenômenos naturais usando essas técnicas estatísticas e aplicá-las em seus trabalhos de conclusão de curso.
1) O documento discute o problema da autocorrelação nos termos de erro em modelos de regressão múltipla.
2) A autocorrelação ocorre quando os termos de erro de períodos diferentes estão correlacionados, violando um pressuposto do modelo de regressão.
3) Vários fatores podem causar autocorrelação, como inércia em séries temporais, variáveis omitidas, forma funcional incorreta do modelo, e defasagens.
1) O documento discute testes de hipóteses para comparar características entre duas amostras, como diferença entre médias e proporções. 2) Apresenta fórmulas para calcular os testes t e z para amostras grandes e pequenas, dependentes ou independentes. 3) Fornece exemplos numéricos ilustrando como aplicar os testes para verificar se há diferenças estatisticamente significativas entre as amostras.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Jean Paulo Mendes Alves
O documento apresenta 15 exercícios sobre correlação e regressão linear. Os exercícios incluem estimar equações de regressão linear, calcular coeficientes de correlação, testar significância estatística e interpretar os resultados para diferentes conjuntos de dados.
O texto visa explicar os passos utilizados para a seleção dos modelos via a metodologia de Box & Jenkins de maneira aplicada (documento compilado para o ensino de cursos introdutórios do assunto para a graduação). Eventuais imprecisões são de responsabilidade do autor
Este documento discute regressão linear, que analisa a relação entre uma variável resposta e uma ou mais variáveis preditoras. Apresenta modelos de regressão simples e múltipla, métodos de seleção de variáveis, diagnósticos de valores atípicos e pressupostos da regressão linear.
Testes de hipóteses para uma amostra.
- Introdução ao teste de hipótese
- Testes de hipóteses para a média (amostras grandes)
- Testes de hipóteses para a média (amostras pequenas)
- Testes de hipóteses para variância e desvio padrão
Apostila de metodos_quantitativos_-_prof._joao_furtadoWannessa Souza
1. O documento discute correlação e regressão linear, com foco em medir a relação estatística entre variáveis.
2. Apresenta o coeficiente de correlação de Pearson (r) para quantificar a força e direção da relação linear entre variáveis. Valores próximos a 1 ou -1 indicam alta correlação positiva ou negativa.
3. Explica como estimar uma equação de regressão linear para modelar a relação entre variável dependente (y) e independente (x), permitindo interpolação e extrapolação de valores.
1) O documento discute medidas de associação e correlação entre variáveis, incluindo o coeficiente de correlação de Pearson.
2) Apresenta exemplos de possíveis relações entre variáveis como idade e altura, gastos com publicidade e faturamento.
3) Discutem conceitos como correlação positiva, negativa e ausência de correlação entre variáveis.
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
O documento descreve um estudo para prever o índice Ibovespa através de um modelo de regressão linear múltipla utilizando variáveis como outros índices de bolsa e indicadores de mercado. Dois modelos são propostos e seus resultados são comparados para verificar qual melhor explica o comportamento do Ibovespa.
1) O documento descreve um modelo de regressão linear simples, apresentando a equação, o método dos mínimos quadrados ordinários para estimar os parâmetros, e os testes de significância dos parâmetros e da regressão como um todo.
2) É apresentado um exemplo numérico ilustrando os cálculos para estimar a reta de regressão e os testes.
3) A regressão é validada através dos testes F e t, indicando que os parâmetros são estatisticamente significativos.
1) A regressão linear é uma técnica estatística amplamente utilizada para modelar a relação entre uma variável dependente e uma ou mais variáveis independentes.
2) O objetivo da modelagem é simplificar problemas complexos e focar na essência da questão.
3) A análise de regressão linear envolve explorar os dados, desenvolver um modelo teórico, identificar o melhor modelo de acordo com os dados e validar o modelo.
Este documento discute o relaxamento das hipóteses da regressão linear clássica, especificamente multicolinearidade, heterocedasticidade e autocorrelação. O autor analisa cada uma dessas violações das hipóteses e apresenta métodos para detectá-las e corrigi-las.
Este documento descreve os conceitos e procedimentos da análise fatorial, incluindo a extração de fatores, critérios para determinar o número de fatores e a interpretação dos mesmos. A análise fatorial é uma técnica estatística que resume um conjunto de variáveis em fatores subjacentes com menor perda de informação.
1) O documento discute o problema da estimação no modelo de regressão múltipla, onde a variável dependente é explicada por múltiplas variáveis independentes.
2) São apresentadas as hipóteses do modelo de regressão múltipla e o método dos mínimos quadrados ordinários para estimar os parâmetros do modelo.
3) Discutem-se também as propriedades dos estimadores, como serem não enviesados, consistentes e eficientes.
Aula de Métodos e Técnicas de Análise da Informação para Planejamento, julho de 2017, UFABC
Apresentação disponível em: https://youtu.be/cQ8ZfzL3SfI
Bases de dados disponíveis em:https://app.box.com/s/4yl70hj73c9mqyh1jb0l8skics4xf8i1
1) O documento discute correlação linear e o coeficiente de correlação de Pearson (r), que mede a intensidade da associação entre duas variáveis quantitativas.
2) r pode variar de -1 a +1, sendo valores negativos indicam correlação inversa e positivos correlação direta. Valores próximos a zero indicam fraca correlação.
3) O documento também apresenta o coeficiente de determinação (r2) e discute pressupostos e limitações do uso de r para avaliar correlação.
O documento discute vários modelos de regressão linear, incluindo regressão múltipla, modelos log-log, log-lin e lin-log. Também aborda propriedades desses modelos como colinearidade e interpretação dos coeficientes.
O documento discute o modelo de regressão linear clássico, incluindo a hipótese de normalidade dos resíduos, propriedades dos estimadores sob essa hipótese, estimação de intervalos de confiança para os parâmetros β1, β2 e σ2, e testes de hipóteses. Explica como construir intervalos de confiança para os parâmetros usando a distribuição t e qui-quadrado e como consultar esses valores críticos na tabela.
1) VAR e VECM são modelos utilizados para analisar séries temporais econômicas inter-relacionadas, capturando suas interdependências e relações de curto e longo prazo.
2) VAR considera todas as variáveis como endógenas e igualmente influentes, enquanto VECM captura relações de longo prazo quando as variáveis são cointegradas.
3) A escolha entre VAR e VECM depende de testes de raiz unitária e cointegração para verificar a estacionariedade das séries e presença de uma
Modelo de regressão linear: aspectos teóricos e computacionais Rodrigo Rodrigues
Este documento apresenta os conceitos e técnicas de regressão linear simples utilizando o software estatístico R. A análise é aplicada a um conjunto de dados sobre tartarugas nas ilhas Galápagos e estima a relação entre número de espécies e espécies endêmicas. Os resultados são analisados por meio de gráficos, testes estatísticos e intervalos de confiança para avaliar a significância do modelo.
Este documento descreve uma disciplina de pós-graduação em estatística multivariada. A disciplina ensina técnicas como regressão linear múltipla, análise de componentes principais e análise discriminante. Os alunos aprenderão a modelar fenômenos naturais usando essas técnicas estatísticas e aplicá-las em seus trabalhos de conclusão de curso.
1) O documento discute o problema da autocorrelação nos termos de erro em modelos de regressão múltipla.
2) A autocorrelação ocorre quando os termos de erro de períodos diferentes estão correlacionados, violando um pressuposto do modelo de regressão.
3) Vários fatores podem causar autocorrelação, como inércia em séries temporais, variáveis omitidas, forma funcional incorreta do modelo, e defasagens.
1) O documento discute testes de hipóteses para comparar características entre duas amostras, como diferença entre médias e proporções. 2) Apresenta fórmulas para calcular os testes t e z para amostras grandes e pequenas, dependentes ou independentes. 3) Fornece exemplos numéricos ilustrando como aplicar os testes para verificar se há diferenças estatisticamente significativas entre as amostras.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Jean Paulo Mendes Alves
O documento apresenta 15 exercícios sobre correlação e regressão linear. Os exercícios incluem estimar equações de regressão linear, calcular coeficientes de correlação, testar significância estatística e interpretar os resultados para diferentes conjuntos de dados.
O texto visa explicar os passos utilizados para a seleção dos modelos via a metodologia de Box & Jenkins de maneira aplicada (documento compilado para o ensino de cursos introdutórios do assunto para a graduação). Eventuais imprecisões são de responsabilidade do autor
Este documento discute regressão linear, que analisa a relação entre uma variável resposta e uma ou mais variáveis preditoras. Apresenta modelos de regressão simples e múltipla, métodos de seleção de variáveis, diagnósticos de valores atípicos e pressupostos da regressão linear.
Testes de hipóteses para uma amostra.
- Introdução ao teste de hipótese
- Testes de hipóteses para a média (amostras grandes)
- Testes de hipóteses para a média (amostras pequenas)
- Testes de hipóteses para variância e desvio padrão
Apostila de metodos_quantitativos_-_prof._joao_furtadoWannessa Souza
1. O documento discute correlação e regressão linear, com foco em medir a relação estatística entre variáveis.
2. Apresenta o coeficiente de correlação de Pearson (r) para quantificar a força e direção da relação linear entre variáveis. Valores próximos a 1 ou -1 indicam alta correlação positiva ou negativa.
3. Explica como estimar uma equação de regressão linear para modelar a relação entre variável dependente (y) e independente (x), permitindo interpolação e extrapolação de valores.
1) O documento discute medidas de associação e correlação entre variáveis, incluindo o coeficiente de correlação de Pearson.
2) Apresenta exemplos de possíveis relações entre variáveis como idade e altura, gastos com publicidade e faturamento.
3) Discutem conceitos como correlação positiva, negativa e ausência de correlação entre variáveis.
Este documento discute como determinar o tamanho adequado de uma amostra para pesquisas. Explica que uma amostra deve ser representativa o suficiente para permitir generalizações sobre a população, mas pequena o suficiente para ser factível. Fornece fórmulas para calcular o tamanho da amostra com base na estimativa da média, proporção ou quando a população é finita.
1) O documento apresenta os conceitos e métodos de regressão linear, incluindo estimação de parâmetros, avaliação do ajuste do modelo e interpretação dos resultados.
2) A regressão linear é usada para modelar a relação entre uma variável dependente e uma ou mais variáveis independentes através de uma equação linear.
3) A qualidade de ajuste do modelo é avaliada por meio da análise da variância, que parte a soma dos quadrados total em parte explicada pelo modelo e parte residual.
A análise de regressão é um método estatístico que modela a relação entre uma variável dependente e uma ou mais variáveis independentes. A regressão linear simples estima a relação entre duas variáveis através de uma equação da forma Y = b0 + b1X, onde b0 e b1 são estimados usando o método dos mínimos quadrados. A análise de resíduos é importante para verificar a adequação do modelo ajustado.
Esta é uma apresentação, referente a disciplina de métodos quantitativos do programa de pós graduação em Finanças e Economia da Universidade Federal do Rio Grande do Sul.
Neste material, você pode aprender sobre a aplicação dos modelos de regressão linear.
Este documento apresenta o conceito e cálculo de medidas de tendência central, especificamente a média aritmética, mediana e moda. Inclui exemplos de como calcular a média para dados isolados, tabelados e agrupados em intervalos de classe. Há também atividades propostas para que o leitor calcule médias com base em dados apresentados.
1. O documento discute regressão linear e correlação linear, com o objetivo de prever uma variável dependente (Y) a partir de uma ou mais variáveis independentes (X).
2. A regressão linear simples usa uma única variável X para prever Y, enquanto a regressão linear múltipla usa múltiplas variáveis X.
3. A correlação de Pearson mede o grau de relacionamento entre variáveis X e Y, usando o coeficiente de correlação r, que varia de -1 a 1 indicando uma relação negativa ou positiva.
Este documento apresenta um resumo do conteúdo do curso de Estatística I ministrado na Universidade do Vale do Paraíba. O curso aborda tópicos como representação e operações com dados por meio de tabelas de frequência e histogramas, variáveis aleatórias, probabilidades, distribuições de probabilidade para variáveis discretas e contínuas.
1) O documento discute o modelo de regressão linear normal clássico, incluindo a hipótese de normalidade dos resíduos e propriedades dos estimadores sob essa hipótese.
2) É explicado como construir intervalos de confiança para os parâmetros β1, β2 e variância dos resíduos σ2 usando distribuições t e qui-quadrado respectivamente.
3) Testes de hipóteses também são discutidos como meio de inferir se as estimativas estão próximas dos parâmetros reais da população.
O documento discute a bioestatística, resumindo sua história desde os primeiros levantamentos estatísticos no Egito Antigo até sua expansão para áreas como saúde pública e ciências sociais. Também define bioestatística como a aplicação de métodos estatísticos para solucionar problemas biológicos e discute termos e conceitos importantes como população, amostra e parâmetros.
Universidade Privada de Angola bioestatistica.pdfamaroalmeida74
1) O documento discute métodos estatísticos paramétricos manuais e computacionais e sua aplicação em saúde.
2) Apresenta conceitos como parâmetro, estimador, diagrama de dispersão, correlação linear e coeficiente de correlação de Pearson.
3) Explica como o coeficiente de correlação quantifica a força da relação linear entre variáveis e pode variar de -1 a 1.
O documento apresenta um estudo sobre a relação entre idade e tempo de reação a estímulos em 20 pessoas. Foram analisados dados sobre sexo, idade e tempo de reação por meio de tabelas, gráficos e estatísticas descritivas. Uma regressão linear mostrou que quanto maior a idade, menor o tempo de reação, com a idade explicando 20,12% da variação no tempo de reação.
Este documento discute correlações bivariadas e regressão linear. Explica como analisar o relacionamento entre duas variáveis para verificar se existem correlações. Também apresenta como obter um modelo de relação entre variáveis usando regressão linear simples e múltipla.
Este documento apresenta o professor e o curso de estatística em exercícios para o Banco Central. O curso terá foco na resolução de exercícios da banca Cesgranrio para preparação da prova do Bacen. O curso abordará formas de apresentação de dados, medidas de posição, medidas de dispersão, probabilidade e distribuições normal e binomial através da resolução de exercícios da Cesgranrio.
1) O documento discute conceitos estatísticos como distribuição normal, uniforme e probabilidades. 2) A distribuição normal é descrita como uma das mais importantes e amplamente usadas em pesquisas, com média e desvio padrão como parâmetros. 3) Exemplos ilustram como calcular probabilidades usando a distribuição normal reduzida e tabelas Z.
1) O documento discute conceitos fundamentais de amostragem populacional para pesquisas, incluindo definição de população-alvo e amostrada, tipos de amostragem e cálculo do tamanho amostral mínimo para estimar médias e proporções com margem de erro e nível de confiança pré-determinados.
2) É apresentada fórmula para cálculo do tamanho amostral mínimo para estudos que comparam médias ou proporções entre dois grupos, levando em conta desvio-padrão, diferença m
1) O documento discute conceitos fundamentais de amostragem populacional para pesquisas, incluindo definição de população-alvo e amostrada, tipos de amostragem e cálculo do tamanho amostral mínimo para estimar médias e proporções com margem de erro e nível de confiança pré-determinados.
2) É apresentada fórmula para cálculo do tamanho amostral mínimo para estudos que comparam médias ou proporções entre dois grupos, levando em conta desvio-padrão, diferença m
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptxLuizHenriquedeAlmeid6
Slideshare Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24, Pr Henrique, EBD NA TV, Lições Bíblicas, 2º Trimestre de 2024, adultos, Tema, A CARREIRA QUE NOS ESTÁ PROPOSTA, O CAMINHO DA SALVAÇÃO, SANTIDADE E PERSEVERANÇA PARA CHEGAR AO CÉU, Coment Osiel Gomes, estudantes, professores, Ervália, MG, Imperatriz, MA, Cajamar, SP, estudos bíblicos, gospel, DEUS, ESPÍRITO SANTO, JESUS CRISTO, Com. Extra Pr. Luiz Henrique, de Almeida Silva, tel-What, 99-99152-0454, Canal YouTube, Henriquelhas, @PrHenrique, https://ebdnatv.blogspot.com/
2. Prof.SauloJardim–saulojardim@id.uff.br
Trataremos agora o conceito de regressão de maneira mais formal.
Regressão simples (com apenas duas variáveis).
A análise de regressão trata, em grande parte, da estimação e/ou
previsão do valor médio (para a população) da variável dependente
com base nos valores conhecidos, ou fixados, da variável
explanatória.
Dados do Exemplo 1: Eles se referem auma população total de 60
famílias de uma comunidade hipotética e sua renda (X) e despesas de
consumo(Y) semanais, ambas medidas em dólares. As 60 famílias foram
divididas em dez grupos de renda(de $ 80 a $ 260) e as despesas
semanais de cada família nos vários grupos são apresentadas na
tabela.
4. Prof.SauloJardim–saulojardim@id.uff.br
É importante distinguir esses valores esperados condicionais dos
valores esperados incondicionais das despesas semanais de consumo,
E(Y).
Se somarmos as despesas de consumo semanais das 60 famílias da
população e dividirmos esse total por 60, obteremos o número $
121,20 ($ 7.272/60), que é a média incondicional, ou esperada, das
despesas de consumo semanais, E(Y);
Perguntas importantes:“Qual o valor esperado das despesas de consumo
semanais médias de uma família?” Mas se perguntarmos: “Qual o valor
esperado das despesas de consumo semanais de uma família cuja renda
mensal é de $ 140?”.
Respostas: 121,20 e 101, respectivamente.
5. Prof.SauloJardim–saulojardim@id.uff.br
Se unirmos os valores médios condicionais obteremos o que é
conhecido como linha de regressão populacional (LRP) ou, de modo
mais geral, a curva de regressão populacional.
6. Prof.SauloJardim–saulojardim@id.uff.br
Conhecer a classe de renda pode nos permitir prever melhor o valor
médio das despesas de consumo do que se não tivermos esse dado.
Esta, é a essência da análise de regressão.
Em termos geométricos, uma curva de regressão populacional é apenas
o local geométrico das médias condicionais da variável dependente
para os valores fixados da(s) variável(is) explanatória(s).
Na figura abaixo, para cada X (isto é, nível de renda), há uma
população de valores de Y (despesas de consumo semanais) que se
espalham em torno da média (condicional) desses valores de Y. Para
simplificarmos, pressupomos que esses valores de Y distribuem-se
simetricamente em torno de seus respectivos valores médios
(condicionais) e que a linha (ou curva) passa por esses valores
médios (condicionais).
8. Prof.SauloJardim–saulojardim@id.uff.br
Relembrando a definição de Regressão:
A análise de regressão diz respeito ao estudo da dependência
de uma variável, a variável dependente, em relação a uma ou
mais variáveis, as variáveis explanatórias, visando estimar
e/ou prever o valor médio (da população) da primeira em
termos dos valores conhecidos ou fixados (em amostragens
repetidas) das segundas.
9. Prof.SauloJardim–saulojardim@id.uff.br
Cada média condicional 𝐸(𝑌|𝑋𝑖) é uma função de 𝑋𝑖, em que 𝑋𝑖 é um dado
valor de X. Simbolicamente,
Conhecida também como a função de esperança condicional (FEC) ou
função de regressão populacional (FRP).
Qual é a forma assumida pela função f(𝑋𝑖)? Supondo que FRP 𝐸(𝑌|𝑋𝑖) é
uma função linear de 𝑋𝑖 do tipo:
CONCEITO DE FUNÇÃO DE REGRESSÃO POPULACIONAL (FRP)
10. Prof.SauloJardim–saulojardim@id.uff.br
𝛽1 e 𝛽2 são parâmetros desconhecidos, mas fixos, chamados de
coeficientes de regressão;
𝛽1 e 𝛽2 também são conhecidos como intercepto e coeficiente angular,
respectivamente.
Nosso interese na Análise de Regreessão, é estimar os valores de
incógnitas como 𝛽1 e 𝛽2com base nas observações de Y e X.
11. Prof.SauloJardim–saulojardim@id.uff.br
Em termos geométricos, a curva de regressão nesse caso é uma reta.
Sob essa interpretação, uma função de regressão como
𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐 𝑿 𝟐
não é uma função linear, porque a variável X aparece com um expoente
ou índice de 2.
O SIGNIFICADO DO TERMO LINEAR
LINEARIDADE NOS PARÂMETROS
Um modelo não linear nos parâmetros: 𝑬 𝒀 𝑿𝒊 = 𝜷 𝟏 + 𝜷 𝟐
𝟐
X
13. Prof.SauloJardim–saulojardim@id.uff.br
Tabela 2.1 e a Figura
2.1 mostram que as
despesas de consumo de
uma família não
aumentam
necessariamente quando
aumenta seu nível de
renda. CERTO ?
ESPECIFICAÇÃO ESTOCÁSTICA DA FRP
14. Prof.SauloJardim–saulojardim@id.uff.br
O que podemos dizer sobre a relação entre as despesas de consumo de
uma família e um nível de renda? Vemos na Figura 2.1 que para um
nível de renda 𝑋𝑖 as despesas médias de consumo de uma família
agrupam-se em torno do consumo médio de todas as famílias deste
nível 𝑋𝑖 , isto é, em torno de sua esperança condicional. Portanto,
podemos expressar o desvio individual de 𝑌𝑖 em torno de seu valor
esperado como a seguir:
em que o desvio 𝑢𝑖 é uma variável aleatória não-observável que assume
valores positivos ou negativos. Tecnicamente, 𝑢𝑖 é conhecida como
distúrbio estocástico ou termo de erro estocástico.
15. Prof.SauloJardim–saulojardim@id.uff.br
Podemos dizer que a despesa de consumo de uma família individual,
dado seu nível de renda, pode ser expressa como a soma de dois
componentes: (1) 𝐸(𝑌|𝑋𝑖) , que é simplesmente o gasto médio em consumo
de todas as famílias com o mesmo nível de renda (esse componente é
conhecido como sistemático ou determinístico); e (2) 𝑢𝑖 , que é o
componente aleatório ou não-sistemático.
Podemos escrever a equação da seguinte maneira:
16. Prof.SauloJardim–saulojardim@id.uff.br
Se tomarmos o valor esperado nos dois lados da equação, obtemos:
em que levamos em consideração o fato de que o valor esperado de uma
constante é a própria constante. Observe que 𝐸 𝑌 𝑋𝑖 , uma vez que o
valor de 𝑋𝑖 é fixo, é uma constante.
Observe atentamente que, na Equação, tomamos a esperança condicional
condicionada a um dado X. Como 𝐸 𝑌𝑖 𝑋𝑖 é o mesmo que 𝐸 𝑌 𝑋𝑖 , a
Equação implica que
17. Prof.SauloJardim–saulojardim@id.uff.br
Assim, a suposição de que a linha de regressão passa pelas médias
condicionais de Y implica que os valores médios condicionais de 𝑢𝑖
(condicionados a um dado X) sejam iguais a zero.
O termo de erro ui representa todas as variáveis omitidas no modelo,
mas que coletivamente afetam Y.
A pergunta óbvia é: por que não introduzir essas variáveis
explicitamente no modelo? Ou seja, por que não formular um modelo de
regressão com o máximo de variáveis possíveis? Há muitas razões:
O SIGNIFICADO DO TERMO “ERRO ESTOCÁSTICO”
18. Prof.SauloJardim–saulojardim@id.uff.br
1- Caráter vago da teoria.
2- Indisponibilidade de dados.
3- Variáveis essenciais versus variáveis periféricas/secundárias.
4- Caráter intrinsecamente aleatório do comportamento humano (mesmo se
conseguirmos incluir todas as variáveis relevantes no modelo, sempre haverá uma aleatoriedade
“intrínseca” nos Y individuais que não pode ser explicada por mais que nos esforcemos para tanto. Os
termos de erro, os u, podem refletir bem a aleatoriedade intrínseca.)
5- Variáveis proxy pouco adequadas.
6- Princípio da parcimônia (de acordo com a navalha de Occam,12 o ideal seria formular
o modelo de regressão mais simples possível.).
7-Forma funcional errada (função linear ou não linear?).
19. Prof.SauloJardim–saulojardim@id.uff.br
Nossa tarefa agora é estimar a função de regressão com base em
informações amostrais.
A pergunta é: com base na amostra da Tabela 2.4, é possível prever
as despesas médias de consumo semanais Y para a população como um
todo correspondentes aos X escolhidos? Em outras palavras, podemos
estimar a FRP com base nos dados da amostra?
Não seremos capazes de estimar “precisamente” a FRP devido a
variações amostrais.
A FUNÇÃO DE REGRESSÃO AMOSTRAL (FRA)
22. Prof.SauloJardim–saulojardim@id.uff.br
Qual das duas linhas de regressão representa a linha de regressão
populacional “real”?
Não há como ter certeza absoluta de qual das linhas de regressão
representa a verdadeira linha (ou curva) de regressão populacional.
Devido às variações amostrais, elas são, no máximo, aproximações da
verdadeira regressão populacional.
Agora, tal como no caso da FRP subjacente à linha de regressão
populacional, podemos formular o conceito de função de regressão
amostral (FRA) para representar a linha de regressão da amostra.
23. Prof.SauloJardim–saulojardim@id.uff.br
Observe que um estimador, também conhecido como estatística
(amostral), é apenas uma regra ou fórmula ou método que nos diz como
estimar o parâmetro da população com base nas informações oferecidas
pela amostra que temos à mão. Um valor numérico em particular obtido
pela aplicação do estimador é conhecido como estimativa.
Podemos expressar a FRA na Equação em sua forma estocástica como a
seguir:
24. Prof.SauloJardim–saulojardim@id.uff.br
Resumindo, então, verificamos que nosso objetivo primordial na
análise de regressão é estimar a FRP:
com base na FRA
Obviamente, 𝑌𝑖 superestima a verdadeira 𝐸 𝑌 𝑋𝑖 para o 𝑋𝑖 nela
mostrado. Da mesma forma, para cada 𝑋𝑖 à esquerda do ponto A, a FRA
subestimará a verdadeira FRP. Contudo, pode ver facilmente que essas
sobre e subestimações são inevitáveis devido às variações amostrais.
26. Prof.SauloJardim–saulojardim@id.uff.br
A pergunta crítica agora é: sabendo que a FRA não é mais do que uma
aproximação da FRP, podemos formular uma regra ou um método que
torne essa aproximação a mais próxima possível? Em outras palavras,
como devemos formular a FRA para que 𝛽1fique o mais próximo possível
do verdadeiro 𝜷 𝟏 e 𝛽2 do verdadeiro 𝜷 𝟐 , mesmo que nunca venhamos a
saber quais são os verdadeiros 𝜷 𝟏 e 𝜷 𝟐?
A resposta para essa pergunta ocupará grande parte de nossa atenção
no Capítulo 3. Aqui destacamos que é possível desenvolver
procedimentos que nos digam como formular a FRA a fim de espelhar
FRP o mais fielmente possível. É fascinante considerar que isso pode
ser feito mesmo que nunca determinemos a FRP real.