1) As variáveis categóricas só podem ser usadas em regressão linear múltipla depois de serem convertidas em variáveis dummy (0/1).
2) Variáveis dummy representam cada categoria de uma variável nominal ou ordinal, permitindo que sejam incluídas no modelo de regressão.
3) Ao criar variáveis dummy para uma variável categórica, equações separadas são geradas para cada categoria dentro do modelo de regressão.
2. REGRESSÃO LINEAR MÚLTIPLA COM VARIÁVEIS
CATEGÓRICAS
Vimos até agora que as variáveis independentes que são
consideradas na regressão linear múltipla são sempre variáveis
quantitativas.
Mas não é possível usar variáveis categóricas nos modelos de
regressão múltipla?
As variáveis categóricas (nominais ou ordinais) só podem ser
utilizadas em regressão múltipla depois de convertidas em
variáveis dummy (fictícias), que são variáveis dicotómicas 0/1.
3. REGRESSÃO LINEAR MÚLTIPLA COM VARIÁVEIS
CATEGÓRICAS: VARIÁVEIS DUMMY
• Considere o ficheiro
‘Jornalistas TV’. A variável
‘Género’ (0 para homem e 1
para mulher) é uma variável
dummy, logo pode ser
incluída diretamente no
modelo
• A equação da reta de
regressão é dada por:
𝑦 = 469,535 + 62,916 𝑒𝑥𝑝𝑒𝑟𝑖ê𝑛𝑐𝑖𝑎 + 84,459𝑔é𝑛𝑒𝑟𝑜
Os resultados revelam que as
mulheres (género=1) recebem
mensalmente mais 84,459 € do
que os homens.
4. CRIAÇÃO DE VARIÁVEIS
DUMMY
Quando pretendemos incluir num
modelo de regressão múltipla uma
variável categórica que não está
codificada como 0/1, é necessário
criar uma variável dummy.
Um exemplo poderá
ser a criação de uma
variável dummy para a
tipologia, no ficheiro
“casas”. Distinguir a
tipologia numa
regressão múltipla com
o ficheiro casas
Transform
Create
dummy
variable
5. CRIAÇÃO DE VARIÁVEIS DUMMY
Na base de dados são criadas
variáveis 0/1 e no output é
possível é possível identificar a
variável criada e a tipologia que
esta representa.
6. REGRESSÃO LINEAR MÚLTIPLA COM VARIÁVEIS
CATEGÓRICAS: VARIÁVEIS DUMMY
Analisar
Regressão
Linear
Considere o ficheiro casas: pretende-se criar um modelo explicativo do
preço anunciado das casas. Vamos por exemplo considerar a área útil e
as dummies resultantes da tipologia.
7. REGRESSÃO LINEAR MÚLTIPLA COM VARIÁVEIS
CATEGÓRICAS: VARIÁVEIS DUMMY
Considere o modelo 2:
a equação para cada
uma das tipologias é:
YT2(pr anun) =183617,74 – 12428,724 + 1227,742 x (área útil)=171 189,016 +
1227,742 x
YT3(pr anun) =183617,74 + 1227,742 x (área útil)
YT4(pr anun) =183617,74 + 30266,835 + 1227,742 x (área útil) = 213 884,575 +
1227,742 x