O documento descreve os modelos de regressão linear, que objetivam estabelecer uma relação matemática entre uma variável dependente e uma ou mais variáveis independentes. Apresenta o modelo de regressão linear simples, com uma variável dependente e uma independente, e o modelo de regressão linear múltipla, com uma variável dependente e duas ou mais variáveis independentes. Também explica o significado do termo de erro e como os coeficientes são estimados usando o método dos mínimos quadrados ordinários.
Este documento descreve uma disciplina de pós-graduação em estatística multivariada. A disciplina ensina técnicas como regressão linear múltipla, análise de componentes principais e análise discriminante. Os alunos aprenderão a modelar fenômenos naturais usando essas técnicas estatísticas e aplicá-las em seus trabalhos de conclusão de curso.
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
O documento descreve um estudo para prever o índice Ibovespa através de um modelo de regressão linear múltipla utilizando variáveis como outros índices de bolsa e indicadores de mercado. Dois modelos são propostos e seus resultados são comparados para verificar qual melhor explica o comportamento do Ibovespa.
O documento discute séries temporais, definindo-as como conjuntos de dados observados em diferentes momentos no tempo. Apresenta seus principais componentes, incluindo tendência, variações cíclicas e sazonais e variações irregulares. Também explica conceitos-chave como estacionariedade, ruído branco, raiz unitária, cointegração e diferentes modelos para análise e previsão de séries temporais.
Este documento discute análise de regressão, incluindo regressão simples e múltipla. A análise de regressão modela a relação entre variáveis dependentes e independentes. A regressão simples modela a relação entre uma variável dependente e uma variável independente, enquanto a regressão múltipla modela a relação entre uma variável dependente e múltiplas variáveis independentes. Exemplos de aplicação de regressão incluem previsão de custos, produção e preços.
O documento discute estacionariedade de séries temporais. Estacionariedade significa que as propriedades estatísticas de uma série, como média e variância, não mudam ao longo do tempo. Séries estacionárias têm média e variância constantes e covariância que depende apenas da defasagem entre valores. Testes como ADF e KPSS analisam a presença de raiz unitária para verificar se uma série é estacionária ou não.
O documento resume os principais passos para realizar um teste de hipóteses estatísticas, incluindo: 1) Definir as hipóteses nula e alternativa; 2) Calcular a estatística do teste com base na amostra; 3) Determinar a região crítica com base no nível de significância; 4) Tomar uma decisão sobre aceitar ou rejeitar a hipótese nula de acordo com a regra de decisão. O documento fornece exemplos detalhados para ilustrar cada um desses passos.
Modelo de regressão linear: aspectos teóricos e computacionais Rodrigo Rodrigues
Este documento apresenta os conceitos e técnicas de regressão linear simples utilizando o software estatístico R. A análise é aplicada a um conjunto de dados sobre tartarugas nas ilhas Galápagos e estima a relação entre número de espécies e espécies endêmicas. Os resultados são analisados por meio de gráficos, testes estatísticos e intervalos de confiança para avaliar a significância do modelo.
O documento descreve os modelos de regressão linear, que objetivam estabelecer uma relação matemática entre uma variável dependente e uma ou mais variáveis independentes. Apresenta o modelo de regressão linear simples, com uma variável dependente e uma independente, e o modelo de regressão linear múltipla, com uma variável dependente e duas ou mais variáveis independentes. Também explica o significado do termo de erro e como os coeficientes são estimados usando o método dos mínimos quadrados ordinários.
Este documento descreve uma disciplina de pós-graduação em estatística multivariada. A disciplina ensina técnicas como regressão linear múltipla, análise de componentes principais e análise discriminante. Os alunos aprenderão a modelar fenômenos naturais usando essas técnicas estatísticas e aplicá-las em seus trabalhos de conclusão de curso.
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
O documento descreve um estudo para prever o índice Ibovespa através de um modelo de regressão linear múltipla utilizando variáveis como outros índices de bolsa e indicadores de mercado. Dois modelos são propostos e seus resultados são comparados para verificar qual melhor explica o comportamento do Ibovespa.
O documento discute séries temporais, definindo-as como conjuntos de dados observados em diferentes momentos no tempo. Apresenta seus principais componentes, incluindo tendência, variações cíclicas e sazonais e variações irregulares. Também explica conceitos-chave como estacionariedade, ruído branco, raiz unitária, cointegração e diferentes modelos para análise e previsão de séries temporais.
Este documento discute análise de regressão, incluindo regressão simples e múltipla. A análise de regressão modela a relação entre variáveis dependentes e independentes. A regressão simples modela a relação entre uma variável dependente e uma variável independente, enquanto a regressão múltipla modela a relação entre uma variável dependente e múltiplas variáveis independentes. Exemplos de aplicação de regressão incluem previsão de custos, produção e preços.
O documento discute estacionariedade de séries temporais. Estacionariedade significa que as propriedades estatísticas de uma série, como média e variância, não mudam ao longo do tempo. Séries estacionárias têm média e variância constantes e covariância que depende apenas da defasagem entre valores. Testes como ADF e KPSS analisam a presença de raiz unitária para verificar se uma série é estacionária ou não.
O documento resume os principais passos para realizar um teste de hipóteses estatísticas, incluindo: 1) Definir as hipóteses nula e alternativa; 2) Calcular a estatística do teste com base na amostra; 3) Determinar a região crítica com base no nível de significância; 4) Tomar uma decisão sobre aceitar ou rejeitar a hipótese nula de acordo com a regra de decisão. O documento fornece exemplos detalhados para ilustrar cada um desses passos.
Modelo de regressão linear: aspectos teóricos e computacionais Rodrigo Rodrigues
Este documento apresenta os conceitos e técnicas de regressão linear simples utilizando o software estatístico R. A análise é aplicada a um conjunto de dados sobre tartarugas nas ilhas Galápagos e estima a relação entre número de espécies e espécies endêmicas. Os resultados são analisados por meio de gráficos, testes estatísticos e intervalos de confiança para avaliar a significância do modelo.
Este documento discute testes de hipóteses em estatística. Ele explica que testes de hipóteses avaliam se uma afirmação sobre um parâmetro populacional é apoiada por evidências de dados amostrais. O documento também discute o processo de formular hipóteses nula e alternativa, escolher um nível de significância, calcular estatísticas de teste e valores críticos, e tomar uma decisão sobre se rejeitar ou não a hipótese nula.
1) O documento apresenta os conceitos e métodos de regressão linear, incluindo estimação de parâmetros, avaliação do ajuste do modelo e interpretação dos resultados.
2) A regressão linear é usada para modelar a relação entre uma variável dependente e uma ou mais variáveis independentes através de uma equação linear.
3) A qualidade de ajuste do modelo é avaliada por meio da análise da variância, que parte a soma dos quadrados total em parte explicada pelo modelo e parte residual.
Este documento apresenta uma revisão de conceitos estatísticos aplicados às finanças. Introduz variáveis aleatórias discretas e contínuas e suas respectivas funções de probabilidade e densidade de probabilidade. Explica como calcular probabilidades através da área sob a curva da função densidade entre intervalos.
O documento discute testes de hipóteses estatísticas, incluindo: (1) o teste de hipótese avalia inferências sobre uma população com base em uma amostra; (2) a teoria de Popper afirma que não se pode provar nada, apenas refutar hipóteses; (3) os principais conceitos incluem hipótese estatística, teste de hipótese e tipos de hipóteses.
Exercício: Determinar a classe de funções para os coeficientes não constantes...Maths Tutoring
Exercício: Determinar a classe de funções para os coeficientes não constantes de uma equação diferencial de 2.ª ordem onde se aplique uma mudança na variável independente.
O algoritmo define a composição inicial da mistura e propriedades, calcula a bolha de vapor no equilíbrio para diferentes temperaturas, resolve um sistema de equações para determinar a nova composição a cada incremento de tempo, e repete os cálculos até alcançar o tempo total, retornando então à composição inicial.
Formulario inferencia estatistica - 1 e 2 populacoesPedro Casquilho
[1] O documento apresenta os principais testes estatísticos paramétricos e não paramétricos para a análise de uma e duas populações, incluindo intervalos de confiança e testes de hipóteses. [2] Aborda testes para amostras independentes e emparelhadas, considerando parâmetros populacionais conhecidos e desconhecidos. [3] Discutem-se também os conceitos de magnitude do efeito, distribuição amostral e estatísticas de teste.
1. O documento discute regressão linear e correlação linear, com o objetivo de prever uma variável dependente (Y) a partir de uma ou mais variáveis independentes (X).
2. A regressão linear simples usa uma única variável X para prever Y, enquanto a regressão linear múltipla usa múltiplas variáveis X.
3. A correlação de Pearson mede o grau de relacionamento entre variáveis X e Y, usando o coeficiente de correlação r, que varia de -1 a 1 indicando uma relação negativa ou positiva.
1) A regressão linear é uma técnica estatística amplamente utilizada para modelar a relação entre uma variável dependente e uma ou mais variáveis independentes.
2) O objetivo da modelagem é simplificar problemas complexos e focar na essência da questão.
3) A análise de regressão linear envolve explorar os dados, desenvolver um modelo teórico, identificar o melhor modelo de acordo com os dados e validar o modelo.
O documento discute testes de hipóteses estatísticas, incluindo: (1) o teste de hipótese avalia inferências sobre uma população com base em uma amostra; (2) a teoria de Popper diz que não se pode provar nada, apenas refutar hipóteses; (3) os principais conceitos incluem hipóteses estatísticas, testes de hipóteses e tipos de hipóteses.
O documento apresenta definições de termos relacionados a equações diferenciais, incluindo variáveis dependentes e independentes, equações diferenciais ordinárias e parciais, lineares e não-lineares, e soluções explícitas e implícitas. Também discute a importância das equações diferenciais para descrever fenômenos físicos.
O documento discute conceitos básicos de estatística como variáveis aleatórias, distribuições de probabilidade e modelos probabilísticos. Ele apresenta exemplos práticos para ilustrar esses conceitos, como um sobre a montagem de um produto e a distribuição do lucro por peça montada. Também define noções como valor médio, variância, desvio padrão e funções de distribuição para variáveis aleatórias discretas.
Este documento apresenta os conceitos e procedimentos básicos para a realização de testes de hipóteses unilaterais e bilaterais para a média populacional. Inicialmente, define as hipóteses nula e alternativa e discute os tipos de erros possíveis. Em seguida, explica como determinar a região crítica para os diferentes tipos de teste e como tomar a decisão final baseada na estimativa amostral e na região crítica.
O documento discute variáveis aleatórias contínuas, definindo-as como funções que assumem valores em um intervalo de números reais. Explica como atribuir probabilidades a variáveis contínuas usando funções de densidade de probabilidade, e como calcular medidas como média, variância e probabilidades para variáveis aleatórias contínuas usando integrais. Fornece exemplos ilustrativos sobre profundidade de lençol freático e tempo de teste.
Este documento discute equações diferenciais ordinárias de primeira ordem. Aborda equações diferenciais lineares e não lineares, sistemas autônomos e não autônomos, existência e unicidade de soluções, dependência das soluções em relação às condições iniciais e parâmetros, e elementos da teoria qualitativa de equações diferenciais como campos vetoriais e fluxos.
Formulario estatistica descritiva univariada e bivariava 2013Pedro Casquilho
1) O documento apresenta os principais conceitos estatísticos descritivos univariados e bivariados, incluindo medidas de tendência central, dispersão, forma e associação.
2) São descritas tabelas de frequência, medidas de localização como média e mediana, medidas de dispersão como desvio padrão e amplitude interquartílica, e distribuições de probabilidade como a normal.
3) As estatísticas bivariadas incluem covariância, coeficientes de correlação como o de Pearson, e propriedades de distribuições conjuntas como a
O método de Euler aproxima a solução de equações diferenciais de primeira ordem usando a série de Taylor para estimar os valores da função em pontos próximos ao inicial, gerando uma curva que une esses pontos e convergindo para a solução exata à medida que os intervalos entre pontos diminuem.
O documento discute o cálculo de estatísticas como covariância, correlação e regressão linear para um conjunto de dados. Há uma "pegadinha" no enunciado que força um modelo de regressão sem intercepto que não é o melhor para os dados. Isso faz com que algumas fórmulas e propriedades da regressão linear não se apliquem corretamente.
O documento discute o modelo de regressão linear simples. Explica que a regressão analisa a dependência entre uma variável dependente e uma ou mais variáveis explicativas, estimando o valor médio da primeira em termos dos valores das segundas. Também apresenta o método dos mínimos quadrados ordinários para estimar os parâmetros da regressão linear simples a partir de uma amostra, de modo a aproximar a regressão amostral da regressão populacional.
A heterocedasticidade é um conceito fundamental na análise de dados estatísticos e econômicos, especialmente em modelos de regressão. Esse termo refere-se à situação em que a variância dos erros de um modelo estatístico não é constante em relação às variáveis explicativas. Em outras palavras, a dispersão dos erros não é uniforme em toda a extensão das variáveis independentes. Isso pode levar a problemas na estimação dos parâmetros do modelo e na interpretação dos resultados.
Para compreender melhor a heterocedasticidade, é útil considerar um exemplo. Suponha que estejamos interessados em examinar a relação entre o salário dos funcionários de uma empresa e seu nível de educação, idade e experiência profissional. Utilizamos um modelo de regressão para estimar essa relação, mas ao analisar os resíduos do modelo, percebemos que a variância dos erros aumenta à medida que o salário médio dos funcionários aumenta. Isso indica a presença de heterocedasticidade nos dados.
Existem várias causas potenciais para a heterocedasticidade. Uma delas é a presença de outliers nos dados, ou seja, observações que se desviam significativamente da tendência geral dos dados. Outra causa pode ser a especificação incorreta do modelo, onde a relação funcional entre as variáveis não é adequadamente capturada.
Os efeitos da heterocedasticidade podem ser problemáticos. Por exemplo, os estimadores de mínimos quadrados ordinários (MQO), comumente usados em modelos de regressão, podem produzir estimativas imprecisas e ineficientes quando os erros são heterocedásticos. Isso pode levar a erros padrão incorretos, o que por sua vez afeta a inferência estatística sobre os parâmetros do modelo.
Felizmente, existem várias técnicas para lidar com a heterocedasticidade. Uma abordagem comum é a utilização de estimadores robustos, como os estimadores de mínimos quadrados generalizados (MQG), que são menos sensíveis à presença de heterocedasticidade. Além disso, é possível transformar as variáveis envolvidas no modelo para estabilizar a variância dos erros.
É importante identificar e corrigir a heterocedasticidade, pois ela pode distorcer as conclusões e interpretações tiradas a partir do modelo estatístico. Portanto, os analistas de dados devem estar atentos à possibilidade desse fenômeno e utilizar as técnicas apropriadas para mitigar seus efeitos, garantindo assim a robustez e confiabilidade das análises estatísticas realizadas.
Este documento apresenta os conceitos básicos de regressão linear simples, incluindo a obtenção da equação da reta de regressão por meio do método dos mínimos quadrados e a análise dos resultados, verificando pressupostos e significância estatística da regressão por meio de testes.
Este documento discute testes de hipóteses em estatística. Ele explica que testes de hipóteses avaliam se uma afirmação sobre um parâmetro populacional é apoiada por evidências de dados amostrais. O documento também discute o processo de formular hipóteses nula e alternativa, escolher um nível de significância, calcular estatísticas de teste e valores críticos, e tomar uma decisão sobre se rejeitar ou não a hipótese nula.
1) O documento apresenta os conceitos e métodos de regressão linear, incluindo estimação de parâmetros, avaliação do ajuste do modelo e interpretação dos resultados.
2) A regressão linear é usada para modelar a relação entre uma variável dependente e uma ou mais variáveis independentes através de uma equação linear.
3) A qualidade de ajuste do modelo é avaliada por meio da análise da variância, que parte a soma dos quadrados total em parte explicada pelo modelo e parte residual.
Este documento apresenta uma revisão de conceitos estatísticos aplicados às finanças. Introduz variáveis aleatórias discretas e contínuas e suas respectivas funções de probabilidade e densidade de probabilidade. Explica como calcular probabilidades através da área sob a curva da função densidade entre intervalos.
O documento discute testes de hipóteses estatísticas, incluindo: (1) o teste de hipótese avalia inferências sobre uma população com base em uma amostra; (2) a teoria de Popper afirma que não se pode provar nada, apenas refutar hipóteses; (3) os principais conceitos incluem hipótese estatística, teste de hipótese e tipos de hipóteses.
Exercício: Determinar a classe de funções para os coeficientes não constantes...Maths Tutoring
Exercício: Determinar a classe de funções para os coeficientes não constantes de uma equação diferencial de 2.ª ordem onde se aplique uma mudança na variável independente.
O algoritmo define a composição inicial da mistura e propriedades, calcula a bolha de vapor no equilíbrio para diferentes temperaturas, resolve um sistema de equações para determinar a nova composição a cada incremento de tempo, e repete os cálculos até alcançar o tempo total, retornando então à composição inicial.
Formulario inferencia estatistica - 1 e 2 populacoesPedro Casquilho
[1] O documento apresenta os principais testes estatísticos paramétricos e não paramétricos para a análise de uma e duas populações, incluindo intervalos de confiança e testes de hipóteses. [2] Aborda testes para amostras independentes e emparelhadas, considerando parâmetros populacionais conhecidos e desconhecidos. [3] Discutem-se também os conceitos de magnitude do efeito, distribuição amostral e estatísticas de teste.
1. O documento discute regressão linear e correlação linear, com o objetivo de prever uma variável dependente (Y) a partir de uma ou mais variáveis independentes (X).
2. A regressão linear simples usa uma única variável X para prever Y, enquanto a regressão linear múltipla usa múltiplas variáveis X.
3. A correlação de Pearson mede o grau de relacionamento entre variáveis X e Y, usando o coeficiente de correlação r, que varia de -1 a 1 indicando uma relação negativa ou positiva.
1) A regressão linear é uma técnica estatística amplamente utilizada para modelar a relação entre uma variável dependente e uma ou mais variáveis independentes.
2) O objetivo da modelagem é simplificar problemas complexos e focar na essência da questão.
3) A análise de regressão linear envolve explorar os dados, desenvolver um modelo teórico, identificar o melhor modelo de acordo com os dados e validar o modelo.
O documento discute testes de hipóteses estatísticas, incluindo: (1) o teste de hipótese avalia inferências sobre uma população com base em uma amostra; (2) a teoria de Popper diz que não se pode provar nada, apenas refutar hipóteses; (3) os principais conceitos incluem hipóteses estatísticas, testes de hipóteses e tipos de hipóteses.
O documento apresenta definições de termos relacionados a equações diferenciais, incluindo variáveis dependentes e independentes, equações diferenciais ordinárias e parciais, lineares e não-lineares, e soluções explícitas e implícitas. Também discute a importância das equações diferenciais para descrever fenômenos físicos.
O documento discute conceitos básicos de estatística como variáveis aleatórias, distribuições de probabilidade e modelos probabilísticos. Ele apresenta exemplos práticos para ilustrar esses conceitos, como um sobre a montagem de um produto e a distribuição do lucro por peça montada. Também define noções como valor médio, variância, desvio padrão e funções de distribuição para variáveis aleatórias discretas.
Este documento apresenta os conceitos e procedimentos básicos para a realização de testes de hipóteses unilaterais e bilaterais para a média populacional. Inicialmente, define as hipóteses nula e alternativa e discute os tipos de erros possíveis. Em seguida, explica como determinar a região crítica para os diferentes tipos de teste e como tomar a decisão final baseada na estimativa amostral e na região crítica.
O documento discute variáveis aleatórias contínuas, definindo-as como funções que assumem valores em um intervalo de números reais. Explica como atribuir probabilidades a variáveis contínuas usando funções de densidade de probabilidade, e como calcular medidas como média, variância e probabilidades para variáveis aleatórias contínuas usando integrais. Fornece exemplos ilustrativos sobre profundidade de lençol freático e tempo de teste.
Este documento discute equações diferenciais ordinárias de primeira ordem. Aborda equações diferenciais lineares e não lineares, sistemas autônomos e não autônomos, existência e unicidade de soluções, dependência das soluções em relação às condições iniciais e parâmetros, e elementos da teoria qualitativa de equações diferenciais como campos vetoriais e fluxos.
Formulario estatistica descritiva univariada e bivariava 2013Pedro Casquilho
1) O documento apresenta os principais conceitos estatísticos descritivos univariados e bivariados, incluindo medidas de tendência central, dispersão, forma e associação.
2) São descritas tabelas de frequência, medidas de localização como média e mediana, medidas de dispersão como desvio padrão e amplitude interquartílica, e distribuições de probabilidade como a normal.
3) As estatísticas bivariadas incluem covariância, coeficientes de correlação como o de Pearson, e propriedades de distribuições conjuntas como a
O método de Euler aproxima a solução de equações diferenciais de primeira ordem usando a série de Taylor para estimar os valores da função em pontos próximos ao inicial, gerando uma curva que une esses pontos e convergindo para a solução exata à medida que os intervalos entre pontos diminuem.
O documento discute o cálculo de estatísticas como covariância, correlação e regressão linear para um conjunto de dados. Há uma "pegadinha" no enunciado que força um modelo de regressão sem intercepto que não é o melhor para os dados. Isso faz com que algumas fórmulas e propriedades da regressão linear não se apliquem corretamente.
O documento discute o modelo de regressão linear simples. Explica que a regressão analisa a dependência entre uma variável dependente e uma ou mais variáveis explicativas, estimando o valor médio da primeira em termos dos valores das segundas. Também apresenta o método dos mínimos quadrados ordinários para estimar os parâmetros da regressão linear simples a partir de uma amostra, de modo a aproximar a regressão amostral da regressão populacional.
A heterocedasticidade é um conceito fundamental na análise de dados estatísticos e econômicos, especialmente em modelos de regressão. Esse termo refere-se à situação em que a variância dos erros de um modelo estatístico não é constante em relação às variáveis explicativas. Em outras palavras, a dispersão dos erros não é uniforme em toda a extensão das variáveis independentes. Isso pode levar a problemas na estimação dos parâmetros do modelo e na interpretação dos resultados.
Para compreender melhor a heterocedasticidade, é útil considerar um exemplo. Suponha que estejamos interessados em examinar a relação entre o salário dos funcionários de uma empresa e seu nível de educação, idade e experiência profissional. Utilizamos um modelo de regressão para estimar essa relação, mas ao analisar os resíduos do modelo, percebemos que a variância dos erros aumenta à medida que o salário médio dos funcionários aumenta. Isso indica a presença de heterocedasticidade nos dados.
Existem várias causas potenciais para a heterocedasticidade. Uma delas é a presença de outliers nos dados, ou seja, observações que se desviam significativamente da tendência geral dos dados. Outra causa pode ser a especificação incorreta do modelo, onde a relação funcional entre as variáveis não é adequadamente capturada.
Os efeitos da heterocedasticidade podem ser problemáticos. Por exemplo, os estimadores de mínimos quadrados ordinários (MQO), comumente usados em modelos de regressão, podem produzir estimativas imprecisas e ineficientes quando os erros são heterocedásticos. Isso pode levar a erros padrão incorretos, o que por sua vez afeta a inferência estatística sobre os parâmetros do modelo.
Felizmente, existem várias técnicas para lidar com a heterocedasticidade. Uma abordagem comum é a utilização de estimadores robustos, como os estimadores de mínimos quadrados generalizados (MQG), que são menos sensíveis à presença de heterocedasticidade. Além disso, é possível transformar as variáveis envolvidas no modelo para estabilizar a variância dos erros.
É importante identificar e corrigir a heterocedasticidade, pois ela pode distorcer as conclusões e interpretações tiradas a partir do modelo estatístico. Portanto, os analistas de dados devem estar atentos à possibilidade desse fenômeno e utilizar as técnicas apropriadas para mitigar seus efeitos, garantindo assim a robustez e confiabilidade das análises estatísticas realizadas.
Este documento apresenta os conceitos básicos de regressão linear simples, incluindo a obtenção da equação da reta de regressão por meio do método dos mínimos quadrados e a análise dos resultados, verificando pressupostos e significância estatística da regressão por meio de testes.
Cap.10 Multicolinearidade.pptCap.10 Multicolinearidade.pptCap.10 Multicolinea...Cleverson Neves
O documento discute o conceito de multicolinearidade em modelos de regressão múltipla. A multicolinearidade ocorre quando duas ou mais variáveis explicativas são altamente correlacionadas entre si, dificultando a estimação isolada do efeito de cada variável. No caso de multicolinearidade perfeita, os coeficientes de regressão são indeterminados e seus erros-padrão são infinitos, tornando o modelo instável. Já em casos de alta, mas imperfeita, correlação entre variáveis, a estimação é possível, porém menos precisa
Este capítulo discute a análise de regressão múltipla e a inferência estatística. Apresenta os testes t e intervalos de confiança para os coeficientes de regressão e discute a importância da hipótese de normalidade dos resíduos para a aplicação correta destes testes. Também introduz o teste de Jarque-Bera para avaliar a normalidade dos resíduos.
O documento apresenta uma análise dos principais testes estatísticos paramétricos e não paramétricos utilizados em análise multivariada de dados, incluindo testes t de uma amostra e para amostras independentes, ANOVA, teste de Wilcoxon e teste de Kruskal-Wallis. Exemplos demonstram como aplicar os testes t de amostras independentes para comparar as médias de vendas em dois locais diferentes e analisar se a localização influencia as vendas.
1) O documento discute testes estatísticos aplicados em química analítica, incluindo testes de significância para comparar valores e testes comparativos para avaliar precisão e comparar médias.
2) É explicado como realizar testes t e F, fornecendo exemplos para ilustrar a aplicação destes testes na avaliação de hipóteses.
3) São apresentados valores de referência para o teste F que permitem comparar variâncias e concluir sobre diferenças significativas entre conjuntos de dados.
1. Hipóteses ClássiCas do modelo
H0) O modelo tem que ser linear
H1) E(ui|X)=0 estabelece que não é função das observações dos regressores
não depende dos regressores.
H2)Var(ui)=σ2
estabelece que a variância das perturbações aleatórias é
constante ( hipótese da homocedasticidade)
H3) Cov(ui,uj)=0 a covariancia entre perturbações aleatórias é constante
H4) Cov (ui,xj) = 0 a variável explicativa X não é aleatória pelo que nula a
covariância entre o termo de perturbação e a variável explicativa.
H5) A variável explicativa X assume no conjunto das observações valores
não todos iguais ou seja X não é constante na amostra.
H6) ),0(~ 2
σNui
As pertubações aleatórias ui seguem
Coeficiente de determinação
SQT
SQE
R =2
;
SSRSQESQT +=
Coeficiente de determinação ajustado
kn
n
RR
−
−
×−−=
1
)1(12
∑=
−=
n
i
ii yySSR
1
)ˆ(
• Teste sobre um único Coeficiente βj
Permite testar a significância estatística da variável independente associada
a este teste:
As Hipóteses a testar são : H0: βj=0 vs Ha: βj≠0
Estatística de teste )1(~
)ˆ(
ˆ
−−= knt
jse
j
t
β
β
Regra de teste: Rejeita-se H0 quando Tobs>Test ou
{ })1(2/ −−>= knttWt α
Rejeitar H0 significa que a variável Xj é relevante na explicação do
comportamento da variável Y
• Intervalos de Confiança
∈
−
2
/21
2
2
/2
2
2 k)s-(n
;
k)s-(n
αα χχ
σ
• Teste de significância global para um conjunto adicional de
variáveis
Permite testar se as variáveis adicionais são relevantes para a equação
Pretendemos testar se existe vantagem da inclusão de variáveis explicativas adicionais.
( Este ensaio é equivalente a testar se existe melhoria pela inclusão de variáveis
adicionais)
As Hipóteses a testar são : H0: βj+k=βj+k +1=βj+k +…0=0 vs Ha: ∃βj≠0
Estatística de teste
),1(1~ knk
SR
SRCR
F
q
kn
SQE
SQESQE
F −−−
−
×
−
= α
Regra de teste: Rejeita-se H0 se Fcalc>Fest
Não rejeitar Ho significa que não houve melhoria pelo facto de se adicionar as variáveis
• Teste da aderência global do modelo
Permite testar se o modelo é globalmente relevante para explicar as variável explicativa(
As Hipóteses a testar são : H0: β1=β2=…=βj=0 vs Ha: ∃βj≠0
Estatística de teste
)1,(12
2
~
1
1
−−−
−−
×
−
= knkF
q
kn
R
R
F α
Regra de teste: Rejeita-se H0 se Fcalc>Fest
Não rejeitar Ho corresponde a reconhecer que o modelo proposto não é adequado na sua
globalidade para descrever o comportamento da variável dependente
• Teste de Heterocedasticidade
Ocorre Heterocedasticidade quando é violada a hipótese 2 do modelo
Podemos realizar dois testes.
Ho=σ12
=σ22
=σ32
=…=σj2
versus Ha existe um σi≠σj para algum i ≠j
Teste White
1. Estimar por mínimos quadrados o modelo original e obter os quadrados dos resíduos
de estimação ui2
2. Estimar um modelo com termo independente em que a variável explicada é
...22110
2
+++= xxu δδδ
3. Obter W=nR2
é uma X (p-1) g.l
4. Regra de teste : Rejeita-se Ho quando Wobs<Wcal
5. Pode usar em alternativa p-value Prob(Wobs)<α
A rejeição da hipótese nula de serem iguais todos os coeficientes das varáveis X constitui
evidência estatística da heterocedasticidade.
Teste de Breush Pagan
1. Estimar por mínimos quadrados o modelo original e obter os quadrados dos resíduos
de estimação u2
.
2. Estimar um modelo com termo independente em que a variável explicada é
erroxxxu kk +++++= δδδδ ...ˆ 22110
2
3.Estatística de teste
),1(1~ knk
SR
SRCR
F
q
kn
SQE
SQESQE
F −−−
−
×
−
= α
)1,(12
ˆ
2
ˆ
~
1
2
2
−−−
−−
×= knk
u
u
F
k
kn
R
R
F α
Consequências da Heterocedasticidade
• O estimadores deixam de ser eficientes, embora, continuem a ser centrados
e consistentes.
• Todos os testes ( F e t deixam de ser válidos)
• Teste da boa especificação (Teste Reset)
É um teste de especificação da forma funcional do modelo
2
3322110 ˆˆ yyxxxy γγββββ +++++=
As Hipóteses a testar são
H0: Forma funcional bem especificada vs Ha: Forma funcional mal especificada.
Regra de teste: Rejeita-se H0 se Fcalc>Fest
Não rejeitar Ho corresponde a reconhecer que o modelo proposto apresenta má
especificação e como tal não deve ser usado para explicar a variável y
• Teste sobre um único Coeficiente βj
Permite testar a significância estatística da variável independente associada
a este teste:
As Hipóteses a testar são : H0:
*
jj ββ = vs Ha:
*
jj ββ ≠
Estatística de teste
)1(~
)ˆ(
*ˆ
−−
−
= kn
jj
t
jse
t
β
ββ
Regra de teste: Rejeita-se H0 quando Tobs>Test ou
{ })1(2/ −−>= knttWt α
Rejeitar H0 significa que a variável Xj é relevante na explicação do
comportamento da variável Y
• Intervalos de Confiança
] [j)tˆse(jˆ;j)tˆse(jˆ
1)-k-(n/2;1)-k-(n/2; αα βββββ −−∈j
Teste da qualidade do Modelo
Para avaliar a qualidade do modelo
usamos o coefieciente de
determinação
R2=1-SQE/SQT=i%
I% é a percentagem explicada pela
variação das variáveis explicativas
E 1-i% e a percentegem que o modelo
não explica
Um modelo bom tem i≥80%
Estimaçao pelo método mínimos
quadrados
β(estimado)=(XT
X)-1
XT
Y
R2
=SQE/SQT=(βt
xt
y-ny2
(media de
y)/(Yt
Y-nY(media de y)2
)
e’e=yt
y-yT
y)( estes últimos y são
estimados)
Estaimado(σ2
)=e’e/(n-k)
Var(β)=σ2(σestimado)
(xt
x)-1