Esta é uma apresentação, referente a disciplina de métodos quantitativos do programa de pós graduação em Finanças e Economia da Universidade Federal do Rio Grande do Sul.
Neste material, você pode aprender sobre a aplicação dos modelos de regressão linear.
Gestão da evasão na EAD: discussão a partir de um modelo preditivoANGRAD
Este documento discute o uso de modelos estatísticos preditivos para gerenciar a evasão em cursos de educação a distância. Ele apresenta: 1) Os objetivos de identificar fatores que impactam a evasão e construir modelos preditivos usando regressão logística binária; 2) A metodologia de coleta e análise de dados dos alunos para desenvolver os modelos; 3) Os resultados dos modelos preditivos de evasão para os cursos de Administração e Matemática, incluindo as variáveis significativas e suas odds
O documento apresenta uma ementa ideal para um curso superior em Matemática Financeira, Probabilidade e Estatística, Economia, Contabilidade e Modelagem. A ementa inclui tópicos como mercados financeiros, juros, fluxos de caixa, probabilidade, estatística, economia micro e macro, contabilidade e modelagem estatística.
Este documento discute análise de regressão, incluindo regressão simples e múltipla. A análise de regressão modela a relação entre variáveis dependentes e independentes. A regressão simples modela a relação entre uma variável dependente e uma variável independente, enquanto a regressão múltipla modela a relação entre uma variável dependente e múltiplas variáveis independentes. Exemplos de aplicação de regressão incluem previsão de custos, produção e preços.
Este documento apresenta uma introdução à análise de regressão. Discute conceitos como natureza da regressão, conceitos de regressão para população e amostra, estimação e hipóteses. Também fornece exemplos ilustrativos sobre regressão linear.
Este documento discute conceitos e métodos de análise de regressão linear. Ele explica o que é regressão simples e múltipla, como interpretar os coeficientes de regressão, e métodos para selecionar variáveis preditoras, como entrada forçada, hierárquica e passo a passo. Também aborda diagnósticos para identificar valores atípicos e casos influentes e a importância de validar se um modelo pode ser generalizado.
1. O documento discute análise de correlação e regressão, técnicas estatísticas usadas para medir o relacionamento entre variáveis.
2. A correlação mede o grau de relacionamento entre variáveis, enquanto a regressão estima uma equação matemática que descreve a relação entre variáveis.
3. Os dados usados podem ser de séries temporais ou seção transversal e combinações delas, coletados de amostras sobre variáveis econômicas, financeiras ou contábeis relacionadas ao agronegócio.
Análise de Regressão: aspectos teóricos e computacionaisRodrigo Rodrigues
Este documento apresenta uma introdução sobre estatística realizada por Rodrigo Lins Rodrigues. Ele discute conceitos como natureza de variáveis, correlação versus regressão, pressupostos do modelo de regressão linear e softwares estatísticos. Rodrigo também demonstra na prática como utilizar o software R e o pacote Rcommander para análises estatísticas descritivas e regressão linear em uma base de dados.
Gestão da evasão na EAD: discussão a partir de um modelo preditivoANGRAD
Este documento discute o uso de modelos estatísticos preditivos para gerenciar a evasão em cursos de educação a distância. Ele apresenta: 1) Os objetivos de identificar fatores que impactam a evasão e construir modelos preditivos usando regressão logística binária; 2) A metodologia de coleta e análise de dados dos alunos para desenvolver os modelos; 3) Os resultados dos modelos preditivos de evasão para os cursos de Administração e Matemática, incluindo as variáveis significativas e suas odds
O documento apresenta uma ementa ideal para um curso superior em Matemática Financeira, Probabilidade e Estatística, Economia, Contabilidade e Modelagem. A ementa inclui tópicos como mercados financeiros, juros, fluxos de caixa, probabilidade, estatística, economia micro e macro, contabilidade e modelagem estatística.
Este documento discute análise de regressão, incluindo regressão simples e múltipla. A análise de regressão modela a relação entre variáveis dependentes e independentes. A regressão simples modela a relação entre uma variável dependente e uma variável independente, enquanto a regressão múltipla modela a relação entre uma variável dependente e múltiplas variáveis independentes. Exemplos de aplicação de regressão incluem previsão de custos, produção e preços.
Este documento apresenta uma introdução à análise de regressão. Discute conceitos como natureza da regressão, conceitos de regressão para população e amostra, estimação e hipóteses. Também fornece exemplos ilustrativos sobre regressão linear.
Este documento discute conceitos e métodos de análise de regressão linear. Ele explica o que é regressão simples e múltipla, como interpretar os coeficientes de regressão, e métodos para selecionar variáveis preditoras, como entrada forçada, hierárquica e passo a passo. Também aborda diagnósticos para identificar valores atípicos e casos influentes e a importância de validar se um modelo pode ser generalizado.
1. O documento discute análise de correlação e regressão, técnicas estatísticas usadas para medir o relacionamento entre variáveis.
2. A correlação mede o grau de relacionamento entre variáveis, enquanto a regressão estima uma equação matemática que descreve a relação entre variáveis.
3. Os dados usados podem ser de séries temporais ou seção transversal e combinações delas, coletados de amostras sobre variáveis econômicas, financeiras ou contábeis relacionadas ao agronegócio.
Análise de Regressão: aspectos teóricos e computacionaisRodrigo Rodrigues
Este documento apresenta uma introdução sobre estatística realizada por Rodrigo Lins Rodrigues. Ele discute conceitos como natureza de variáveis, correlação versus regressão, pressupostos do modelo de regressão linear e softwares estatísticos. Rodrigo também demonstra na prática como utilizar o software R e o pacote Rcommander para análises estatísticas descritivas e regressão linear em uma base de dados.
Modelo de regressão linear: aspectos teóricos e computacionais Rodrigo Rodrigues
Este documento apresenta os conceitos e técnicas de regressão linear simples utilizando o software estatístico R. A análise é aplicada a um conjunto de dados sobre tartarugas nas ilhas Galápagos e estima a relação entre número de espécies e espécies endêmicas. Os resultados são analisados por meio de gráficos, testes estatísticos e intervalos de confiança para avaliar a significância do modelo.
Este documento descreve uma disciplina de pós-graduação em estatística multivariada. A disciplina ensina técnicas como regressão linear múltipla, análise de componentes principais e análise discriminante. Os alunos aprenderão a modelar fenômenos naturais usando essas técnicas estatísticas e aplicá-las em seus trabalhos de conclusão de curso.
Começando a construir um sentido de uso da estatística para a vida cotidiana. Experimentando dados em situações reais e aprendendo a utilizar ferramentas de relevância para análises simples porém fundamentais.
O documento apresenta um estudo socioeconômico de empregados de uma empresa, com informações sobre seis variáveis: estado civil, grau de instrução, número de filhos, salário, idade e região de origem. São apresentados os conceitos de variável qualitativa, quantitativa, nominal, ordinal, discreta e contínua. Instruções para construção de tabelas de frequências simples e conjuntas para analisar o comportamento das variáveis.
Este documento fornece uma introdução aos conceitos básicos de estatística descritiva. Discute a distinção entre estatística descritiva e analítica, variáveis qualitativas e quantitativas, distribuição de frequências, medidas estatísticas e representação gráfica de dados. O documento serve como um guia para estudantes aprenderem os fundamentos da estatística descritiva.
Este documento descreve os conceitos e procedimentos da análise fatorial, incluindo a extração de fatores, critérios para determinar o número de fatores e a interpretação dos mesmos. A análise fatorial é uma técnica estatística que resume um conjunto de variáveis em fatores subjacentes com menor perda de informação.
O documento introduz os principais conceitos e métodos de organização de dados estatísticos. Ele discute o que é estatística, seus ramos, conceitos como população, amostra e variáveis, o método estatístico que inclui planejamento, coleta e organização de dados, e formas de representar dados como tabelas e gráficos.
Este plano de ensino descreve uma disciplina de Estatística para o curso de Tecnologia em Gestão da Tecnologia da Informação. O plano inclui objetivos gerais e específicos, conteúdo programático com 12 tópicos, estratégias de trabalho interativas e avaliação com notas do professor e projeto integrado.
O documento fornece uma introdução às noções básicas de bioestatística. Apresenta definições de estatística e bioestatística, histórico da estatística, variáveis estatísticas e medidas de tendência central como média, mediana e moda. Também aborda distribuição de frequência, elementos de uma distribuição de frequência e medidas de posição e dispersão de dados.
Este documento apresenta uma introdução ao aprendizado de máquina, definindo o conceito, distinguindo-o de inteligência artificial e apresentando alguns tipos e aplicações. Explica os conceitos de aprendizado supervisionado, não-supervisionado e por reforço, além de apresentar exemplos de regressão e classificação no aprendizado supervisionado.
U1S4 - PPCP e Técnicas de Previsão de Demanda.pdfCelsoCiamponi1
O documento descreve técnicas de previsão de demanda, incluindo métodos qualitativos como Delphi e análise de cenários, e métodos quantitativos como médias móveis, exponenciais e regressão linear para análise de tendências.
Este documento discute regressão linear, que analisa a relação entre uma variável resposta e uma ou mais variáveis preditoras. Apresenta modelos de regressão simples e múltipla, métodos de seleção de variáveis, diagnósticos de valores atípicos e pressupostos da regressão linear.
O documento apresenta os principais conceitos da estatística descritiva, incluindo: (1) variáveis estatísticas, tipos de variáveis e exemplos; (2) população e amostra; (3) distribuição de frequências por valores e por classes como formas de apresentar dados; (4) medidas de tendência central e dispersão como formas de resumir dados.
Estatística aplicada à gestão de recursos humanosaurelio2machado
O documento discute a estatística aplicada à gestão de recursos humanos. A estatística é uma ciência matemática que coleta, organiza e analisa dados para tirar conclusões válidas e tomar decisões. Ela é aplicada em diversas áreas como agricultura, economia, educação e recursos humanos.
O documento fornece uma introdução aos conceitos básicos de estatística, incluindo medidas de tendência central, medidas de dispersão, tipos de gráficos, probabilidade e distribuições. Exemplos de como analisar indicadores usando cartas de controle são dados para ilustrar como a estatística pode ser usada para tomada de decisão.
1) O documento apresenta um curso sobre modelos de regressão linear ministrado pelo professor Rodrigo Lins Rodrigues.
2) São revisados conceitos de estatística descritiva e introduzidos os conceitos de regressão linear simples e múltipla.
3) São explicadas as diferenças entre correlação e regressão e apresentados os pressupostos dos modelos de regressão linear.
Este documento apresenta um estudo sobre a relação entre a variação do peso de indivíduos e fatores como tratamento, sexo e hábitos de fumar. O objetivo é testar empiricamente esta relação usando análise de regressão linear múltipla. Foram coletados dados de 150 indivíduos em um programa dietético e verificados pressupostos estatísticos como linearidade, normalidade e homoscedasticidade dos resíduos. Os resultados indicam que 89,5% da variação do peso é explicada pelo modelo, com efeitos signific
Este documento discute métodos quantitativos para previsão de demanda. Ele explica a importância de ter uma quantidade suficiente de dados históricos e a periodicidade correta de coleta de dados. Também apresenta três métodos principais para previsão de demanda - séries temporais, causais e simulação - e discute quando cada um é mais adequado. A próxima aula irá cobrir previsões de demanda para produtos sazonais.
Aula 04 - Tópicos em Gestão da Informação Medidas de posição relativaDalton Martins
O documento discute medidas de posição relativa, especificamente o percentil e como calculá-lo. O percentil indica a porcentagem de valores em um conjunto de dados que estão abaixo de um valor específico. Por exemplo, um valor no percentil 90 significa que 90% dos dados estão abaixo desse valor.
Modelo de regressão linear: aspectos teóricos e computacionais Rodrigo Rodrigues
Este documento apresenta os conceitos e técnicas de regressão linear simples utilizando o software estatístico R. A análise é aplicada a um conjunto de dados sobre tartarugas nas ilhas Galápagos e estima a relação entre número de espécies e espécies endêmicas. Os resultados são analisados por meio de gráficos, testes estatísticos e intervalos de confiança para avaliar a significância do modelo.
Este documento descreve uma disciplina de pós-graduação em estatística multivariada. A disciplina ensina técnicas como regressão linear múltipla, análise de componentes principais e análise discriminante. Os alunos aprenderão a modelar fenômenos naturais usando essas técnicas estatísticas e aplicá-las em seus trabalhos de conclusão de curso.
Começando a construir um sentido de uso da estatística para a vida cotidiana. Experimentando dados em situações reais e aprendendo a utilizar ferramentas de relevância para análises simples porém fundamentais.
O documento apresenta um estudo socioeconômico de empregados de uma empresa, com informações sobre seis variáveis: estado civil, grau de instrução, número de filhos, salário, idade e região de origem. São apresentados os conceitos de variável qualitativa, quantitativa, nominal, ordinal, discreta e contínua. Instruções para construção de tabelas de frequências simples e conjuntas para analisar o comportamento das variáveis.
Este documento fornece uma introdução aos conceitos básicos de estatística descritiva. Discute a distinção entre estatística descritiva e analítica, variáveis qualitativas e quantitativas, distribuição de frequências, medidas estatísticas e representação gráfica de dados. O documento serve como um guia para estudantes aprenderem os fundamentos da estatística descritiva.
Este documento descreve os conceitos e procedimentos da análise fatorial, incluindo a extração de fatores, critérios para determinar o número de fatores e a interpretação dos mesmos. A análise fatorial é uma técnica estatística que resume um conjunto de variáveis em fatores subjacentes com menor perda de informação.
O documento introduz os principais conceitos e métodos de organização de dados estatísticos. Ele discute o que é estatística, seus ramos, conceitos como população, amostra e variáveis, o método estatístico que inclui planejamento, coleta e organização de dados, e formas de representar dados como tabelas e gráficos.
Este plano de ensino descreve uma disciplina de Estatística para o curso de Tecnologia em Gestão da Tecnologia da Informação. O plano inclui objetivos gerais e específicos, conteúdo programático com 12 tópicos, estratégias de trabalho interativas e avaliação com notas do professor e projeto integrado.
O documento fornece uma introdução às noções básicas de bioestatística. Apresenta definições de estatística e bioestatística, histórico da estatística, variáveis estatísticas e medidas de tendência central como média, mediana e moda. Também aborda distribuição de frequência, elementos de uma distribuição de frequência e medidas de posição e dispersão de dados.
Este documento apresenta uma introdução ao aprendizado de máquina, definindo o conceito, distinguindo-o de inteligência artificial e apresentando alguns tipos e aplicações. Explica os conceitos de aprendizado supervisionado, não-supervisionado e por reforço, além de apresentar exemplos de regressão e classificação no aprendizado supervisionado.
U1S4 - PPCP e Técnicas de Previsão de Demanda.pdfCelsoCiamponi1
O documento descreve técnicas de previsão de demanda, incluindo métodos qualitativos como Delphi e análise de cenários, e métodos quantitativos como médias móveis, exponenciais e regressão linear para análise de tendências.
Este documento discute regressão linear, que analisa a relação entre uma variável resposta e uma ou mais variáveis preditoras. Apresenta modelos de regressão simples e múltipla, métodos de seleção de variáveis, diagnósticos de valores atípicos e pressupostos da regressão linear.
O documento apresenta os principais conceitos da estatística descritiva, incluindo: (1) variáveis estatísticas, tipos de variáveis e exemplos; (2) população e amostra; (3) distribuição de frequências por valores e por classes como formas de apresentar dados; (4) medidas de tendência central e dispersão como formas de resumir dados.
Estatística aplicada à gestão de recursos humanosaurelio2machado
O documento discute a estatística aplicada à gestão de recursos humanos. A estatística é uma ciência matemática que coleta, organiza e analisa dados para tirar conclusões válidas e tomar decisões. Ela é aplicada em diversas áreas como agricultura, economia, educação e recursos humanos.
O documento fornece uma introdução aos conceitos básicos de estatística, incluindo medidas de tendência central, medidas de dispersão, tipos de gráficos, probabilidade e distribuições. Exemplos de como analisar indicadores usando cartas de controle são dados para ilustrar como a estatística pode ser usada para tomada de decisão.
1) O documento apresenta um curso sobre modelos de regressão linear ministrado pelo professor Rodrigo Lins Rodrigues.
2) São revisados conceitos de estatística descritiva e introduzidos os conceitos de regressão linear simples e múltipla.
3) São explicadas as diferenças entre correlação e regressão e apresentados os pressupostos dos modelos de regressão linear.
Este documento apresenta um estudo sobre a relação entre a variação do peso de indivíduos e fatores como tratamento, sexo e hábitos de fumar. O objetivo é testar empiricamente esta relação usando análise de regressão linear múltipla. Foram coletados dados de 150 indivíduos em um programa dietético e verificados pressupostos estatísticos como linearidade, normalidade e homoscedasticidade dos resíduos. Os resultados indicam que 89,5% da variação do peso é explicada pelo modelo, com efeitos signific
Este documento discute métodos quantitativos para previsão de demanda. Ele explica a importância de ter uma quantidade suficiente de dados históricos e a periodicidade correta de coleta de dados. Também apresenta três métodos principais para previsão de demanda - séries temporais, causais e simulação - e discute quando cada um é mais adequado. A próxima aula irá cobrir previsões de demanda para produtos sazonais.
Aula 04 - Tópicos em Gestão da Informação Medidas de posição relativaDalton Martins
O documento discute medidas de posição relativa, especificamente o percentil e como calculá-lo. O percentil indica a porcentagem de valores em um conjunto de dados que estão abaixo de um valor específico. Por exemplo, um valor no percentil 90 significa que 90% dos dados estão abaixo desse valor.
Este documento discute conceitos estatísticos básicos como população, amostra, medidas de tendência central e estatística descritiva. Apresenta um exemplo numérico para calcular a média, mediana e moda de um conjunto de dados, além de solicitar o cálculo de uma média ponderada.
O documento apresenta conceitos sobre indicadores de desempenho, incluindo suas propriedades e métodos de cálculo. Define indicadores como formas de representar características quantitativas de produtos e processos para acompanhar e melhorar resultados. Explica que indicadores devem ter metas para permitir avaliação do desempenho e que métodos como cálculo de atingimento, variação e projeção são utilizados para análise.
O documento apresenta um resumo sobre o modelo de suavização exponencial ETS. Discute os principais componentes do modelo ETS - erro, tendência e sazonalidade - e como eles podem ser especificados de forma aditiva ou multiplicativa. Também aborda a formulação do modelo ETS na abordagem de estado-espaço e como os 30 modelos ETS possíveis são representados nessa abordagem.
Entender quando é necessário utilizar análise fatorial;
Entender as premissas para a utilização da análise fatorial;
Diferenciar A.F de outras técnicas multivariadas;
Entender os principais métodos de rotação;
Determinar o número de fatores a serem extraídos;
Nomear fatores;
Saber o que é carga fatorial;
Aplicações computacionais.
O documento discute conceitos básicos de regressão linear com duas variáveis, incluindo: (1) a função de regressão populacional que representa a relação entre a variável dependente e independente na população, (2) como estimar esta função usando uma amostra, resultando na função de regressão amostral, (3) como a regressão amostral é uma aproximação imprecisa da regressão populacional devido a variações amostrais.
O documento discute vários métodos e conceitos relacionados ao planejamento e controle de estoques, incluindo: 1) a importância da previsão de demanda para reduzir riscos e beneficiar a organização; 2) os níveis hierárquicos de planejamento estratégico, tático e operacional; 3) tipos de demanda e comportamentos; 4) técnicas de previsão quantitativas e qualitativas como média móvel, exponencial ponderada e MRP.
Administração da Produção - Previsão de Demandadouglas
Este documento discute técnicas de previsão de demanda, incluindo modelos qualitativos como opiniões de executivos e pesquisas de mercado, e modelos quantitativos como média móvel, regressão linear e ajustamento sazonal.
Este documento apresenta uma dissertação de mestrado sobre clusterização baseada em algoritmos fuzzy. O trabalho propõe duas novas distâncias adaptativas para o algoritmo fuzzy c-means e avalia seu desempenho em comparação com outras abordagens. Os resultados experimentais indicam que as novas versões do algoritmo fuzzy c-means com distâncias adaptativas geralmente apresentam melhor desempenho do que métodos similares disponíveis na literatura.
O framework de big data para inteligência de marketing dinâmicaGabriel Peixe
O documento discute o desenvolvimento de uma plataforma de big data para inteligência de marketing que automatiza processos de extração, transformação e carregamento de dados de várias fontes para análise preditiva com o objetivo de melhorar a aquisição, retenção e rentabilidade de clientes. A plataforma será desenvolvida na nuvem da Amazon usando ferramentas como S3, Hadoop e linguagens como Python e Javascript.
O documento descreve o processo de análise de dados para inovação de marca, incluindo a extração de dados de várias fontes, modelagem e análise quantitativa dos dados, criação de personas e identificação de oportunidades para a marca com base nos insights obtidos.
This presentation compiles creative works from various Brazilian and foreign authors that convey Wilex's vision of creativity. It discusses key insights in data science as "seeing below the surface" and "seeing inside the consumer". An insight expresses all that is known about consumers and identifies a specific way a brand can solve problems or create opportunities. The presentation references several works on topics like brand positioning, creative thinking, consumer insights, and the art and science of insights.
O documento discute como as marcas podem se conectar com os consumidores em vários pontos de contato digitais, como websites, redes sociais e dispositivos móveis. Também aborda a importância de entender as emoções e percepções do público-alvo para criar conteúdos relevantes que ocupem um espaço na mente dos consumidores. Por fim, enfatiza a necessidade de criatividade original para se diferenciar da concorrência.
1. Métodos Quantitativos para Finanças e Economia
Análise de Regressão
Jo˜ao F. Caldeira
www.ufrgs.br/ppge/caldeira/
Especializac¸ ˜ao em Economia e Financ¸as, PPGE-UFRGS
Porto Alegre, 12 de setembro de 2017
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 1
2. Introduc¸ ˜ao
• Um modelo de regressão é um meio formal de expressar um ingrediente
fundamental de uma relação:
◦ uma tendência de uma variável resposta (dependente) Y variar de acordo
com a variação de um preditor X de uma maneira sistemática.
• Postularemos que existe uma distribuição de probabilidade de Y para cada nível
de X e que esta distribuição de probabilidade varia de uma maneira sistemática
conforme X varia.
• A análise de regressão foi primeiramente desenvolvida por Sir Francis Galton na
última parte do século XIX.
• Galton estudou a relação entre as alturas de pais e filhos e notou que as alturas
das crianças dos pais mais altos e mais baixos pareciam “reverter” ou “regredir”
para a média do grupo. Ele chamou esta tendência de “regressão à
mediocridade”.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 2
3. Exemplos de Regress˜oes
• Regressão da Inflação (Y) sobre Desemprego (X): primeira versão da curva de
Phillips (em nível.
• Regressão do PIB sobre o Desemprego: Tipo a Lei de Okun (só que esta última é
usando a variação);
• Investimento sobre o PIB: chamam de efeito multiplicador, PIB sobre Investimento:
efeito acelerador;
• Investimento sobre Public Debt (Dívida Pública);
• Dívida Pública sobre Tax Burden (Carga Tributária);
• Investimento sobre Corporate Tax Rate (taxa de imposto corporativo);
• Public Debt sobre Investimento (para ver se o gasto do governo expulsa o
investimento - chamam de efeito crowding out).
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 3
4. Tipos de Dados
• Dados de corte (seção) transversal (coletados no mesmo intervalo de tempo).
◦ Exemplo: o salário de cada um de 100 indivíduos de um inventário.
◦ O mais comum é que os dados sejam quantitativos (salários são medidos em
reais, assim, os dados são números).
◦ Às vezes os dados são qualitativos, mas podem ser convertidos em dados
numéricos, referidas como variáveis dummy.
• Dados de série temporal.
◦ Comum em macroeconomia e finanças: GDP, preços de ações, taxas de
juros, taxa de câmbio, etc.
◦ Os dados são coletados em pontos específicos no tempo (diário, semanal,
mensal, ou todo ano).
• Dados em Painel: dados com componentes de cross-section e de séries
temporais.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 4
5. An´alise de Regress˜ao
• Objetivo da modelagem: simplificar o mundo complexo a nossa volta e nos
concentrar na essência do problema.
• Um modelo não precisa conter todos os detalhes do mundo complexo para ser
útil. Podemos quebrar os problemas em pequenas partes para ajudar na
compreensão.
• Podemos tentar manter constantes algumas das variáveis envolvidas em nosso
estudo afim de nos concentrar nas demais. Entretanto, devemos estar atentos aos
problemas de variável omitida e causalidade reversa para minorar erros nas
nossas conclusões sobre causa e efeito.
• Exemplo (causalidade reversa): em cidades com mais policiais há um número
maior de crimes. Logo, o policiamento aumenta a violência urbana!? O número de
policiais determina a criminalidade ou a criminalidade determina o número de
policiais?
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 5
6. An´alise de Regress˜ao
• A análise de regressão tem pelo menos 200 anos.
• Ela é a técnica de modelagem preditiva mais utilizada por ser simples e efetiva.
• Há, no entanto, várias técnicas mais sofisticadas que surgiram desde então.
Ainda assim, o estudo das té cnicas que iremos ver neste curso servem como
fundação para aplicações mais sofisticadas.
• A técnica é utilizada amplamente nas mais diversas áreas. Exemplos: Marketing,
Economia, Psicologia, Bioinformática.
• Às vezes, é útil transformar ou recodificar os dados para obter um bom modelo.
Enfoques condicionais: logaritmo, inversa, potências, etc...
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 6
7. Modelo Cl´assico de Regress˜ao Linear
• Vamos apresentar os conceitos básicos sobre estimação e testes de uma
regressão usando mínimos quadrados ordinários.
• Definimos um modelo de regressão linear simples como a relação entre Y e X
dada pela seguinte expressão:
Y = β0 + β1X + υ
onde:
◦ Y é a variável dependente, variável resposta, ou regressando;
◦ X é a variável independente, variável explicativa, ou regressor;
◦ β0 e β1 são os coeficientes da regressão, os quais são constantes;
◦ υ é o distúrbio estocástico ou termo de erro.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 7
8. Modelo de Regress˜ao Linear
• Modelo de Regressão Linear Populacional:
• Interpretação dos parâmetros:
◦ β0 (intercepto) ´e o valor da m´edia da distribuic¸ ˜ao de Y em X = 0, nem sempre tem
significado pr´atico como um termo separado (isolado) no modelo;
◦ β1 (inclinac¸ ˜ao) expressa a taxa de mudanc¸a em Y , isto ´e, a mudanc¸a em Y quando ocorre a
mudanc¸a de uma unidade em X.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 8
9. Modelo de Regress˜ao Linear
• Modelo de Regressão Linear Amostral
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 9
10. Motivac¸ ˜ao
• Como estimar o impacto de uma variável sobre a outra, o efeito causal, com base
em uma amostra de dados aleatória?
• Conversa de bar: o governo deve aumentar o número de policiais nas ruas para
reduzir a criminalidade ...
• Conversa de corredor: se a nossa turma fosse menor, o desempenho da classe
seria melhor;
• Conversa com os pais: preciso fazer pós-graduação para que o meu salário
aumente.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 10
11. Causalidade versus correlac¸ ˜ao
• Pesquisadores frequentemente são tentados a inferir uma relação de causa e
efeito entre X e Y quando eles ajustam um modelo de regressão ou realizam
uma análise de correlação.
• Uma associação significativa entre X e Y em ambas as situações não
necessariamente implica numa relação de causa e efeito.
• Correlação: indica a força e a direção do relacionamento linear entre duas
variáveis aleatórias, embora correlação não implique causalidade.
• Regressão: é um método para se estimar a média condicional (valor esperado) de
uma variável Y , dados os valores de algumas outras variáveis X.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 11
12. Construc¸ ˜ao de Modelos de Regress˜ao
• Seleção das variáveis preditoras;
• Escolha do Modelo de Regressão;
• Abrangência do Modelo.
• Obs: O problema, em estudos observacionais, é escolher o conjunto de variáveis
que podem ou devem ser incluídas no modelo.
• Dificuldades Pr´aticas:
◦ Nem todos os dados de interesse estão disponíveis;
◦ A base de dados pode não ser suficientemente ampla;
◦ Os resultados dificilmente podem ser generalizados;
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 12
13. Modelo Cl´assico de Regress˜ao Linear
• 1◦ Passo: Compreender o modelo clássico de regressão linear (MCRL regressão
simples);
• 2◦ Passo: Limitações do modelo;
• 3◦ Passo: Extensão do modelo simples para o modelo de regressão múltipla;
• 4◦ Passo: Testes para a verificação dos pressupostos do MMQO.
• Análise de regressão é uma metodologia estatística que utiliza a relação entre
duas ou mais variáveis quantitativas (ou qualitativas) de tal forma que uma
variável pode ser predita a partir da outra ou outras;
• Estamos interessados na relação entre duas variáveis, as quais chamaremos de
X e Y. Observamos pares de valores X e Y em cada amostra ou unidade
experimental, e vamos usá-los para dizer alguma coisa sobre a relação.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 13
14. Modelo de Regress˜ao Linear
• Considere o modelo com uma variável preditora, em que a função de regressão é
linear. O modelo é dado por:
Y = β0 + β1Xi + υi, i = 1, . . . , N.
onde:
◦ β0 (intercepto); quando a amostra inclui X = 0, β0 é o valor da média de Y
em X = 0, não tem significado prático como um termo separado (isolado) no
modelo.
◦ β1 (inclinação): expressa a variação esperada na variável dependente,
quando a variável independente varia uma unidade. Ele indica a mudança na
média da distribuição de probabilidade de Y por unidade de acréscimo em X.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 14
15. Modelo de Regress˜ao Linear: Exemplo
• Observe o modelo teórico para a estimação das quantidades demandadas:
Qd
= β0 − β1Pi
• Nos modelos teóricos, costuma-se atribuir de antemão valores para β0
(intercepto) e β1 (coeficiente angular).
• Por exemplo:
Qd
= 10 − 2Pi
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 15
16. Modelo de Regress˜ao Linear: Exemplo
• Com a equação em mãos, basta escolher valores para o preço (variável
independente) e descobrir qual será a quantidade demanda para cada nível de
preço;
• O problema é que, na prática, β0 e β1 são desconhecidos.
• Logo, para obter a quantidade demandada para cada nível de preço é preciso
estimar uma função de demanda, ou seja, obter estimativas de β0 e β1.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 16
17. O M´etodo dos M´ınimos Quadrados Ordin´arios (MQO)
• Uma vez que não é possível saber quais os verdadeiros valores dos β′s, não será
possível encontrar a reta de regressão populacional(!)
E(Yi/Xi) = β0 + β1Xi
• Como proceder?
• O objetivo, portanto, é encontrar a reta de regressão que mais se aproxima da reta
regressão populacional; ou seja, descobrir a reta que melhor se ajusta aos dados.
• Observe, portanto, que o desafio é descobrir quais os estimadores (os
betas-chapéu) que mais se aproximam dos verdadeiros valores dos parâmetros
populacionais.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 17
18. O M´etodo dos M´ınimos Quadrados Ordin´arios (MQO)
• É possível escrever o modelo linear de regressão simples como:
Yi = β0 + β1Xi
ou
Yi = E (Yi/Xi) + υi
• Uma vez que E(yi/xi) = β0 + β1xi é uma reta e os β′s são desconhecidos, é
possível utilizar a função de regressão amostral e, em seguida, isolar os resíduos,
ou seja:
Yi = β0 + β1Xi + υi ou
υi = Yi − β0 + β1Xi ou ainda
υi = Yi − Yi
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 18
19. O M´etodo dos M´ınimos Quadrados Ordin´arios (MQO)
• Intuitivamente, o que se busca é a menor distância entre yi e yi, ou seja, a menor
diferença entre o valor estimado (previsto) e o valor observado. Em outros termos,
o menor valor para a soma dos resíduos.
• Para evitar que a soma dos resíduos seja igual a zero, utiliza-se a soma dos
quadrados dos resíduos.
• O método consiste em minimizar a função dada por:
min
β0,β1
N
i=1
ˆυ2
i = min
β0,β1
n
i=1
Yi − β0 − β1Xi
2
• Nesse caso, os valores betas-chapéu estimados serão os melhores estimadores
lineares, pois minimizam a distância entre o valor positivo e o valor esperado.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 19
20. O M´etodo dos M´ınimos Quadrados Ordin´arios (MQO)
• Tomando as derivadas parciais com respeito aos parâmetros e resolvendo as
condições de primeira ordem:
ˆβ1 =
N
i=1
(xi − x) (yi − y)
N
i=1
(xi − x)
=
N
i=1
wi (yi − y)
ˆβ0 = y − ˆβ1x
onde:
wi =
(xi − x)
N
i=1
(xi − x)2
o que mostra que ˆβ1 é uma função linear de y. O mesmo argumento se aplica aos
estimadores de OLS de um modelo de regressão múltiplo.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 20
21. Hip´oteses do Modelo de Regress˜ao Linear
• H1 (Linearidade dos parâmetros): O modelo de regressão linear populacional é
linear nos coeficientes da regressão:
Y = β0 + β1X1 + β2X2 + β3X3 + . . . + βkXk + υ.
• H2 (Amostragem aleatória): Podemos extrair uma amostra aleatória da
população:
{(x1i, . . . , xki, yi) , i = 1, . . . , n}
• H3 (Média Condicional Zero): Condicional aos regressores, o valor esperado do
termo de erro é zero:
E (υ|X1, X2, . . . , Xk) = 0
Esta é a hipótese mais importante do modelo de regressão populacional.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 21
22. Hip´oteses do Modelo de Regress˜ao Linear
• H4 (Ausência de Colinearidade Perfeita): As variáveis explicativas 1, X1, . . . , XK
são linearmente independentes. Logo, Xj, j = 1, . . . , K, não podem ser
constantes.
1 X11 X12 . . . XK1
1 X21 X22 . . . XK2
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 X1n X2n . . . XKn
n×(K+1)
Esta hipótese implica que o posto(X) = K + 1, pois n ≥ K + 1. (Não existe uma
relação linear exata entre os regressores. Com multicolinearidade perfeita, o
modelo não pode ser estimado por OLS. Um dos regressores precisa ser
removido).
• H5 (Homocedasticidade): Condicional aos regressores, a variância do termo de
erro é constante:
var (υ|X1, X2, . . . , Xk) = σ2
υ
ou, a variância condicional da variável dependente é constante.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 22
23. Hip´oteses do Modelo de Regress˜ao Linear
• H6 (Ausência de Correlação Serial): Ausência de correlação serial significa que
os termos de erro não são correlacionados ao longo do tempo:
cov (υi, υj|X) = 0, ∀i, j, i = j.
Esta hipótese refere-se a um modelo de regressão para o qual os dados são
coletados ao longo do tempo.
• H7 (Variação Amostral nos Regressores): Todos os regressores devem ter
variâncias positivas, isto é, nenhum regressor pode ser constante para todas as
observações amostra:
var (Xj) > 0, j = 1, 2, . . . , k.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 23
24. O Teorema de Gauss-Markov
• Sob (algumas) as hipóteses do modelo clássico de regresão linear, os
estimadores ˆβ0, ˆβ1, . . . , ˆβk são os best linear unbiased estimators (BLUE) dos
respectivos coeficientes de regressão populacional (β0, β1, . . . , βk).
• Linear: O estimador ˆβ é uma função linear das variáveis dependentes. Vamos
trabalhar com ˆβ1:
ˆβ1 =
N
i=1
(xi − x) (yi − y)
N
i=1
(xi − x)
=
N
i=1
wi (yi − y)
onde:
wi =
(xi − x)
N
i=1
(xi − x)2
o que mostra que ˆβ1 é uma função linear de y. O mesmo argumento se aplica aos
estimadores de OLS de um modelo de regressão múltiplo.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 24
25. O Teorema de Gauss-Markov
• Unbiased: O valor esperado do estimador de OLS ˆβ é o correspondente
coeficiente da regressão populacional:
E ˆβj = βj, j = 1, 2, . . . , k.
mesmo na presença de heterocedasticidade e correlação serial, os estimadores
de OLS ainda são não-viesados.
• Significa que se pegarmos um número de amostras e estimarmos os parâmetros
populacionais com estas amostras, o valor médio das estimativas será igual ao
valor populacional quando o números de amostras tender a infinito.
E β0 = β0,
E β1 = β1.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 25
26. O Teorema de Gauss-Markov
• Best: Significa que que a variância do estimador de OLS ˆβ é a menor dentre
quaisquer outros estimadores lineares não-viesados:
var ˆβj ≤ var ˜βj , j = 1, 2, . . . , k.
esta propriedade é conhecida como propriedade da eficiência. Todas as
hipóteses enunciadas são necessárias para a validade desta propriedade.
• Eficiência dos estimadores não viesados: o estimador é eficiente e nenhum
outro estimador linear não viesado tem maior precisão (menor variância) . Requer
que a variância seja homocedástica e não autocorrelacionada ao longo do tempo.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 26
27. Propriedade dos Estimadores de M´ınimos Quadrados
• Consistência: Significa que quando o tamanho da amostra cresce, tende a
infinito, a variância dos parâmetros deve convergir para zero e os parâmetros
convergem para os parâmetros populacionais.
◦ Um estimador pode ser viesado e ainda assim consistente, mas não é
possível um estimador ser não viesado e inconsistente.
• Parâmetros normalmente distribuídos: Uma vez que os parâmetros são
médias ponderadas das variáveis dependentes, eles podem ser tratados como
uma média.
◦ De acordo com o teorema do limite central, a média é normalmente
distribuída.
◦ Consequentemente, os estimadores de OLS são normalmente distribuídos
em amostras suficientemente grandes.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 27
28. R-quadrado e R2
-ajustado
• Uma medida da qualidade de ajuste - quão bem o modelo ajustado explica a
variabilidade de Y - é fornecida pelo R-quadrado da regressão, o qual é conhecido
como coeficiente de determinac¸ ˜ao.
• O coeficiente de determinação busca decompor o desvio em torno da média em
uma parte explicada e outra parte inexplicada:
Yi − Y = Yi − Y + Yi − ˆYi + Yi − Y
Explicado
+ Yi − ˆYi
Não-Explicado υi
• Assim, definimos a seguinte partição da soma de quadrados total.
• Soma dos Quadrados dos Total:
SST =
n
i=1
Yi − Y
2
que é a variação total amostral na variável dependente y com respeito à sua
média amostral.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 28
29. R-quadrado e R-quadrado ajustado
• Soma dos Quadrados da Explicada:
SSE =
n
i=1
Yi − Y i
2
que é a variação total amostral nos valores ajustados y com respeito à sua média
amostral.
• Soma dos Quadrados dos Resíduos:
SSR =
n
i=1
Yi − Yi
2
=
n
i=1
υ2
i
que é a variação amostral nos resíduos υ com respeito à sua média amostral, a
qual é igual a zero.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 29
30. R-quadrado e R-quadrado ajustado
• Isso prova que a variação total pode ser decomposta em variação explicada e
variação inexplicada:
SST = SSE + SSR
• Com base nesta relação, o R-quadrado é definido como a razão:
R2
=
SSE
SST
= 1 −
SSR
SST
a qual é a proporção da variação amostral da variável dependente explicada pelo
(s) regressor (es).
• Coeficiente de determinac¸ ˜ao: é uma medida de aderência da regressão, que mede o
sucesso dentro da amostra do modelo de regressão:
0 ≤ R2
≤ 1.
É também interpretado como a proporção da variância da variável dependente
que é explicada pelas variáveis explanatórias.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 30
31. O Coeficiente de determinac¸ ˜ao ajustado - R
2
• Um problema com o R2 é que qualquer variável adicionada ao modelo, por menor
que seja o seu poder de explicação, gera um crescimento no R2 normal.
• Logo, o R2-ajustado busca penalizar a estatística pelo acréscimo de variáveis
irrelevantes.
• O R
2
tem a mesma interpretação que o R2. A diferença é que o R
2
é corrigido
pelo número de graus de liberdade:
R
2
= 1 −
SSR/(n − k − 1)
SST(n − 1)
= 1 − 1 − R2 n − k
n − k − 1
.
• Comparando ambos os R-quadrados, podemos ver que:
R
2
≤ R2
.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 31
32. Exerc´ıcio: MCRL
• Utilizando o banco de dados mroz (contido no xlsx) faça uma regressão via
mínimos quadrados ordinários do log do salário (lwage) sobre uma constante,
edução (educ), experiência (exper) e experiência ao quadrado (expersq).
Interprete os resultados dos coefficientes (Como eles foram calculados? E os
erros-padrão? E R2?)
lwage = β0 + β1educ + β2exper + β3exper
2
• Faça as questões da lista de exercícios.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 32
33. Escolhendo a forma funcional: n˜ao-linearidades
• É possível incorporar algumas não-linearidades em um modelo de regressão
redefinindo os regressores e/ou a variável dependente. Suponha que façamos
W = X2, então Y = β0 + β1X + β2X2 pode ser escrito como
Y = β0 + β1X + β2W + υ.
O qual é uma função linear de W e pode ser estimado por OLS.
• Outras especificações não-lineares tais como a log − log, ou semilog também são
modelos considerados.
• Por exemplo, em:
log Y = β0 + β1 log X + υ.
qual é a resposta de Y a uma mudança marginal em X?
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 33
34. Por que usar o log natural?
• Taxa de Crescimento: A primeira-diferença do logaritmo de Y é
aproximadamente igual a taxa de crescimento de Y .
log yt − log yt−1
∼=
y1 − yt−1
yt−1
• Em termos percentuais,
%∆yt
∼= 100 ∗ ∆ log yt = 100 ∗ (log yt − log yt−1)
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 34
35. Por que usar o log natural?
• O logaritmo natural como expressão da elasticidade:
log(Yt) = α + β log(Xt)
log(Yt) = β∆ log(Xt)
∆ log(Yt)
∆ log(Xt)
= β
• Mas:
∆ log(Yt) = log(Yt) − log(Yt−1) = log
Yt
Yt−1
≈
Yt − Yt−1
Yt−1
• Então:
∆ log(Yt)
∆ log(Xt)
=
[(Yt − Yt−1)/Yt−1]
[(Xt − Xt−1/Xt−1]
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 35
36. Escolhendo a forma funcional: n˜ao-linearidades
• Sabendo a derivada do log: d log Y = dY/Y . Assim:
d log Y
d log X
=
∆Y/Y
∆X/X
= β1
o que significa que uma variação de 1% em X (i.e., ∆X/X) se traduz em uma
variação em Y igual a β1 (∆Y/Y = β1∆X/X).
• Os coeficientes do modelo log − log são expressos como elasticidades.
• Lembre-se que a elasticidade é expressa em porcentagem e não na forma
decimal, portanto, não deve ser multiplicada por 100.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 36
37. Escolhendo a forma funcional: log-linear
• Da mesma forma, se o modelo é log Y = β0 + β1X + υ, então
d log Y
dX
=
∆Y/Y
∆X
= β1
Note que agora não trabalhamos com variação percentual em X, mas sim uma
variação marginal.
• Em outras palavras, se X aumentar uma unidade, a mudança em Y será de
(β1 × 100)%.
• Essa especificação log-linear é amplamente usada na literatura sobre capital
humano. Para calcular a taxa de retorno de um ano a mais de educação, por
exemplo.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 37
38. Escolhendo a forma funcional: linear-log
• Finalmente, se o modelo é Y = β0 + β1 log X + υ, então:
dY
d log X
=
∆Y
∆X/X
= β1,
o que significa que uma variação de 1% em X implica em uma variação em Y de
β1 unidades.
• Note que em todas as especificações os coeficientes das regressões, β′s, são
lineares.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 38
39. Vari´aveis Dummy
• Até agora, todas as variáveis foram assumidas como sendo de natureza
quantitativa.
• No entanto, muitas variáveis interessantes são expressas em termos qualitativos,
como sexo, escolaridade, períodos de tempo e as estações, privado ou público e
assim por diante.
• Estas medidas qualitativas tem que ser transformadas em alguma proxy, de modo
que possam ser representadam e utilizadas em uma regressão.
• Variáveis binárias (dummies) são transformações discretas e usadas para esta
finalidade.
• Uma variável dummy para os homens poderiam, portanto, ser expressa da
seguinte forma:
D =
1 se um homem
0 caso contrário (mulher)
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 39
40. Vari´aveis Dummy de Intercepto
• A forma mais básica de aplicação de variáveis dummy é quando apenas o
intercepto é afetado:
Y = β0 + β1X + β2D + υ.
• Se tormamos a esperança condicional em relação às duas categorias de D que
obtemos:
E[Y |D = 1, X] = β0 + β2 + β1X
E[Y |D = 0, X] = β0 + β1X
• A única coisa que difere entre as duas médias condicionais é o coeficiente da
variável dummy.
• Suponha o seguinte resultado de um modelo de regressão com Y sendo a taxa
de salário hora, D uma dummy para os homens, e X uma variável para anos de
escolaridade.Os erros padrão são dados entre parênteses:
Y = 55.9
8.16
+ 21.9
4.30
D + 2.4
0.63
X
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 40
41. Vari´aveis Dummy de Intercepto
• Use os resultados da regressão para calcular quanto maior é a taxa média de
salário por hora para homens. Primeiro temos que verificar se o coeficiente para a
dummy para o sexo masculino é significativa.
• Na literatura empírica sobre capital humano a forma funcional mais utilizada é a
log-linear:
ln Y = 4.02
0.03
+ 0.18
0.02
D + 0.03
0.01
X
Efeito Marginal: eβ1 − 1 = e0.18
− 1 = 0.197.
• Ou seja, os homens ganham, em média, 19.7 por cento a mais por hora do que as
mulheres, o controlando para a educação.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 41
42. Vari´aveis Dummy de Inclinac¸ ˜ao
• Se voltarmos ao modelo de capital humano, é possível argumentar que a
diferença de salário entre homens e mulheres pode ser devido a diferenças no
seu retorno à educação.
Y = β0 + (β1 + β2D)X + υ
= β0 + β1X + β2(DX) + υ
• Assim, uma maneira de testar se o retorno à educação é diferente entre homens e
mulheres seria testar se β2 é diferente de zero, o que deve ser testado antes de
testar se β1 + β2 é diferente de zero.
• Usando o mesmo conjunto de dados do Exemplo acima. Os resultados são
apresentados a seguir com os erros padrão entre parêntesis:
ln Y = 4.11
0.031
+ 0.024
0.003
X + 0.014
0.001
DX
• Para investigar se há uma diferença no retorno da educação entre homens e
mulheres basta testar o coeficiente estimado para o produto cruzado.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 42
43. Vari´aveis qualitativas com v´arias categorias
• Isso exige uma variável qualitativa com mais de duas categorias. Por exemplo:
D =
0 escola primária
1 escola secundária
2 ensino superior
• Para incluir D diretamente em um modelo de regressão tem que ter certeza de
que o efeito de ir do ensino primário para o ensino secundário na taxa de salário
por hora é do mesmo tamanho do efeito da passagem do ensino secundário para
o ensino pós-secundário.
• Se este não for o caso, temos de permitir diferenças nestes dois efeitos. Existem
pelo menos duas abordagens a este problema.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 43
44. Vari´aveis qualitativas com v´arias categorias
• A primeira e mais básica abordagem é criar três variáveis binárias; uma para cada
nível de ensino, da seguinte forma:
D1 =
0 escola primária
1 caso contrário
D2 =
0 escola secundária
1 caso contrário
D3 =
0 ensino superior
1 caso contrário
• Podemos agora tratar D1, D2 e D3 como três variáveis explicativas, e incluí-las
no modelo de regressão.
• No entanto, é importante evitar a chamado armadilha variável binária (dummy).
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 44
45. Vari´aveis qualitativas com v´arias categorias
• A armadilha da variável dummy aparece quando o analista tenta especificar e
estimar o seguinte modelo:
ln Y = β0 + β1D1 + β2D32 + β3D3 + β4X + υ.
• É matematicamente impossível estimar os parâmetros, pois não há variação na
soma das três variáveis dummy, uma vez que D1 + D2 + D3 = 1 para todas as
observações no conjunto de dados.
• A maneira mais fácil de resolver isso é para excluir uma delas e tratar a categoria
que foi excluída como uma categoria de referência.
ln Y = β0 + β2D2 + β3D3 + β4X + υ.
• Isto é, se D1 é excluída, as outras categorias terão D1 como referência.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 45
46. Vari´aveis qualitativas com v´arias categorias
• β2, portanto, é interpretado como o efeito no salário de ir do ensino primário para
o ensino secundário, e β3 irá representar o efeito no salário de ir do ensino
primário para escolaridade superior.
• Uma alternativa a excluir uma das categorias é de excluir o termo constante, o
que nos daria o modelo:
ln Y = β†
1D1 + β†
2D2 + β†
3D3 + β4X + υ.
• Neste caso as três variáveis dummy irão funcionar como três interceptos neste
modelo; um para cada nível de ensino. Os coeficientes não podem ser
interpretadas como mudanças relativas a este caso.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 46
47. Vari´aveis qualitativas com v´arias categorias
• Comparar e interpretar os resultados:
Especificação I: ln Y = 3.29
0.043
+ 0.154
0.024
D2 + 0.295
0.022
D3 + 0.009
0.001
X
Especificação II: ln Y = 3.29
0.043
D1 + 4.083
0.034
D2 + 4.224
0.036
D3 + 0.009
0.001
X.
onde as três variáveis dummies representam três níveis de ensino, e X
representa a idade do indivíduo.
• A primeira coisa a notar é que β0 = β†
1, β0 + β2 = β†
2 e β0 + β2 + β3 = β†
3.
Assim, as duas especificações estão muito relacionados.
• Além disso β†
2 − β†
1 = β2 e β†
3 − β†
1 = β3.
M´etodos Quantitativos para Financ¸as e EconomiaAn´alise de Regress˜ao – p. 47