INSTITUTO SUPERIOR TÉCNICO
UNIVERSIDADE TÉCNICA DE LISBOA
DISTÂNCIA PERCORRIDA EM TRANSPORTE INDIVIDUAL –
CONSTRUÇÃO DE UM...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776)
ÍNDICE
1. I...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 1
1. INTROD...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 2
2. CATEGO...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 3
 PPGLOB4...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 4
Tabela 2....
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 5
3. ANÁLIS...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 6
contudo, ...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 7
Na Figura...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 8
Figura 3....
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 9
Figura 3....
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 10
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 11
A matriz...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 12
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 13
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 14
FAM = -0...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 15
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 16
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 17
variávei...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 18
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 19
Tanto o ...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 20
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 21
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 22
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 23
Figura 3...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 24
4. ANÁLI...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 25
Nesta so...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 26
Figura 4...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 27
2ª Itera...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 28
Figura 4...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 29
A variân...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 30
Figura 4...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 31
Desta fo...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 32
Figura 4...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 33
5. CONST...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 34
5.1. MOD...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 35
2ª Itera...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 36
Figura 5...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 37
Figura 5...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 38
transpor...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 39
Figura 5...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 40
independ...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 41
Figura 5...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 42
PTIDIST ...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 43
6. CONSI...
Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL
André Ramos (n.º 76819) / Luís Neto (n.º 74776) 44
BIBLIOGR...
Próximos SlideShares
Carregando em…5
×

Distância Percorrida em Transporte Individual - Construção de Um Modelo de Regressão Linear_Relatório

273 visualizações

Publicada em

Técnicas de Apoio ao Planeamento de Transportes. Mestrado de Planeamento e Operação de Transportes, Instituto Superior Téncico, Universidade de Lisboa. Nota do Trabalho 19 / 20.

Support Technics for Transport Planning. MSc Transport Planning and Operation, Instituto Superior Técnico, Lisbon University. Project course grade 19 / 20. Final grade 17 / 20

Publicada em: Engenharia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
273
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Distância Percorrida em Transporte Individual - Construção de Um Modelo de Regressão Linear_Relatório

  1. 1. INSTITUTO SUPERIOR TÉCNICO UNIVERSIDADE TÉCNICA DE LISBOA DISTÂNCIA PERCORRIDA EM TRANSPORTE INDIVIDUAL – CONSTRUÇÃO DE UM MODELO DE REGRESSÃO LINEAR TRABALHO PRÁTICO N.º 1 TÉCNICAS DE APOIO AO PLANEAMENTO DE TRANSPORTES MESTRADO EM PLANEAMENTO E OPERAÇÃO DE TRANSPORTES André Ramos, aluno n.º 76819 Luís Neto, aluno n.º 74776 Professor João Abreu e Silva Lisboa, 6 de Novembro de 2012
  2. 2. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) ÍNDICE 1. INTRODUÇÃO................................................................................................................................1 2. CATEGORIZAÇÃO DAS VARIÁVEIS............................................................................................2 2.1. APRESENTAÇÃO DAS VARIÁVEIS...............................................................................................................................2 2.2. ELIMINAÇÃO DE VARIÁVEIS ......................................................................................................................................3 3. ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS...............................................5 3.1. VARIÁVEIS DE USO DO SOLO ...................................................................................................................................6 3.2. VARIÁVEIS SOCIOECONÓMICAS..............................................................................................................................14 4. ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS.............................................24 5. CONSTRUÇÃO DO MODELO DE REGRESSÃO LINEAR .........................................................33 5.1. MODELO 1 – ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS....................................................................34 5.2. MODELO 2 – ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS....................................................................38 6. CONSIDERAÇÕES FINAIS..........................................................................................................43 BIBLIOGRAFIA.....................................................................................................................................44
  3. 3. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 1 1. INTRODUÇÃO O presente relatório diz respeito à construção de um modelo de regressão linear para o cálculo do peso do uso do automóvel em função de diversas variáveis socioeconómicas, de uso do solo e de mobilidade das freguesias da Área Metropolitana de Lisboa, com recurso à utilização do software IBM® SPSS® Statistics (versão 20). A partir da variável dependente – peso da utilização do automóvel na repartição modal das viagens (ou seja, a distância relativa em TI) – vai estabelecer- se um modelo que represente a relação entre os padrões de mobilidade dos habitantes e algumas características desta população e da área onde residem. Numa primeira fase, agrupar-se-ão as variáveis disponíveis na base de dados fornecida em dois grupos principais – variáveis socioeconómicas e variáveis de uso do solo – para, através da Análise Fatorial Exploratória, as poder “reduzir” a um número mais compacto e trabalhável de fatores do modelo de regressão linear. Num segundo momento, tentou-se construir o modelo de análise fatorial sem categorizar as variáveis independentes, dada a difícil definição concreta do tipo de variável que cada uma é na realidade, tentando avaliar se essa nova análise fatorial é mais adequada aos dados disponíveis. De seguida, foram calculados os coeficientes associados a cada uma das novas variáveis (e às que não forem alvo da análise fatorial), procedendo igualmente às verificações necessárias de modo a garantir que o modelo de regressão linear cumpre as assunções que se exigem, terminando com uma análise crítica do(s) modelo(s) obtido(s).
  4. 4. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 2 2. CATEGORIZAÇÃO DAS VARIÁVEIS 2.1. APRESENTAÇÃO DAS VARIÁVEIS Da base de dados fornecida, relativa a 204 zonas da Área Metropolitana de Lisboa – nalguns casos, contendo agrupamentos de freguesias – constam 34 variáveis, uma das quais (PTIDIST – peso das viagens de transporte individual na repartição modal, em função da distância percorrida) deverá ser utilizada como variável dependente do modelo, pois é aquela que se pretende precisamente quantificar. Assim, as variáveis a testar na construção do modelo são as seguintes:  PTCDIST – peso das viagens de transporte coletivo na repartição modal, em função da distância percorrida;  FAM>1TI – percentagem de famílias com mais de 1 automóvel;  AcTC_TI5 – rácio entre acessibilidade usando transporte coletivo e a acessibilidade usando transporte individual;  LNDENS_GL – logaritmo da densidade global da zona;  PPASSE – percentagem de habitantes com passe de transporte público;  DISTTIHAB – Distância viajada em transporte individual;  PPESSGL1000 – percentagem dos “habitantes globais” (isto é, residentes, trabalhadores e estudantes) a menos de 1 quilómetro de um nó de autoestrada;  PPGLOB400BUS – percentagem de “habitantes globais” a menos de 400 metros de uma paragem de autocarro;  KMVIA/PESSGL – rácio entre infraestruturas rodoviárias e “habitantes globais”;  TXANALF – percentagem de habitantes sem estudos;  TXUNIV – percentagem de habitantes com um grau académico;  TX_SECT_I – percentagem de trabalhadores do setor primário (agricultura e pesca);  TX_SECT_III – percentagem de trabalhadores do setor terciário (serviços e comércio);  IPC – índice de poder de compra;  DEP_EMP_LX – percentagem de habitantes a trabalhar no município de Lisboa;  TX_MOT – taxa de motorização;  COMP – índice de compacidade;  ENTROP – índice de entropia;  MIX – relação entre os habitantes e os trabalhadores e estudantes;
  5. 5. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 3  PPGLOB400TCSP – percentagem de “habitantes globais” a menos de 400 metros de uma estação/paragem de transporte público pesado;  DISTCBD – distância ao centro de Lisboa;  PAURB – percentagem de área urbanizada;  POP – número de residentes;  EMP_EST – número de estudantes e trabalhadores;  PFAM0EMP – percentagem de famílias sem trabalhadores;  PFAM1EMP – percentagem de famílias com 1 trabalhadores;  PFAM2EMP – percentagem de famílias com 2 trabalhadores;  PFAMM2EMP – percentagem de famílias com mais de 2 trabalhadores;  PFAM0LIB – percentagem de famílias com 0 trabalhadores por conta própria;  PFAMM1LIB – percentagem de famílias com 1 ou mais trabalhadores por conta própria;  PFAMCRIANC – percentagem de famílias com crianças;  DIMGLOB – tamanho global (soma de residentes, estudantes e trabalhadores);  LNACTCTI – logaritmo do rácio entre acessibilidade usando transporte coletivo e a acessibilidade usando transporte individual. 2.2. ELIMINAÇÃO DE VARIÁVEIS Das 33 variáveis independentes que poderiam ser usadas na análise fatorial e/ou no modelo de regressão linear, foram, desde logo, abandonadas algumas, nomeadamente:  As variáveis POP e EMP_EST foram assumidas como sendo variáveis meramente “caracterizáveis” e indicativas da zona em questão, sem influência na quota de TI;  As variáveis PFAMM2EMP e PFAMM1LIB foram eliminadas por se tratar de combinações lineares de outras variáveis (PFAM0EMP, PFAM1EMP e PFAM2EMP, no primeiro caso, e PFAMM1LIB, no segundo caso); por sua vez, a variável LNACTCTI também é uma transformação logarítmica da variável AcTC_TI5. Posto isto, optou-se pela categorização destas variáveis em variáveis de uso do solo e variáveis socioeconómicas, como se descreve na Tabela 2.1.
  6. 6. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 4 Tabela 2.1 – Categorização das variáveis Variáveis de uso do solo Variáveis socioeconómicas AcTC_TI5 LNDENS_GL PPESSGL1000 PPGLOB400BUS KMVIA/PESSGL COMP ENTROP MIX PPGLOB400TCSP DISTCBD PAURB. FAM>1TI TXANALF TXUNIV TX_SECT_I TX_SECT_III IPC TX_MOT PFAM0EMP PFAM1EMP PFAM2EMP PFAM0LIB PFAMCRIANC DIMGLOB As variáveis PTCDIST, PPASSE e DISTTIHAB foram englobadas numa terceira categoria (variáveis mais relacionadas com a “mobilidade”) e, por isso, não foram utilizadas nas análises fatoriais efetuadas com separação das variáveis.
  7. 7. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 5 3. ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS A Análise Fatorial Exploratória (AFE) tem o intuito principal de detetar relações latentes entre variáveis de modo a construir fatores que permitam explicar essa relação entre elas, permitindo reduzir o número de variáveis a utilizar noutras análises (como os modelos de regressão linear). De modo a verificar a adequabilidade de um modelo de análise fatorial, existem algumas verificações a fazer:  Medida de adequação da amostragem de Kaiser-Meyer-Olkin (mais conhecido por KMO): compara as correlações simples com as correlações observadas entre variáveis, e em função dos valores assumidos (consoante a Tabela 3.1), “recomenda” a utilização da análise fatorial ou não; Tabela 3.1 – Recomendação da AFE face aos valores de KMO Valor de KMO Recomendação da AFE 0,9 a 1,0 Excelente 0,8 a 0,9 Boa 0,7 a 0,8 Média 0,6 a 0,7 Medíocre 0,5 a 0,6 Mau (mas aceitável) Menor que 0,5 Inaceitável  MSA (Measure of Sampling Adequancy): trata-se de uma particularização do KMO para cada uma das variáveis, sendo representada pela diagonal principal da matriz de anti- imagem, que deve tomar valores superiores a 0,5;  Teste de Esfericidade de Bartlett: embora bastante sensível à dimensão da amostra (o que leva à sua utilização com prudência), obriga a que o p-value seja inferior a 0,001, significado de que as variáveis estão correlacionadas significativamente e os fatores comuns são bastante importantes;  Comunalidades e variância total explicada (ou variância extraída total): as comunalidades são a percentagem de variância de cada variável explicada pelos fatores extraídos, devendo ser sempre superiores a 50%; por sua vez, a variância extraída total pelos fatores com valores próprios (eigenvalues) superiores a 1 deve também ser, no mínimo, superior a 50%; pelo “scree plot” obtido no SPSS®, deve ser possível observar uma inflexão no gráfico assim que os eigenvalues forem inferiores a 1;  Goodness of Fit Index (GFI): índice usado para analisar o ajustamento do modelo de análise fatorial aos dados, devendo tomar valores superiores a 0,9 e, preferencialmente, a 0,95; o GFI tende,
  8. 8. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 6 contudo, a sobrestimar o ajustamento, pelo que se deve calcular o GFI ajustado (que leva em conta os graus de liberdade e o número de variâncias-covariâncias não redundantes);  Root Mean Square Residual (RMSR*): índice usado igualmente para medir o ajustamento do modelo aos dados, devendo tomar valores inferiores a 0,1 e, preferencialmente a 0,05. De referir que, para a estimação dos fatores relativos quer ao uso do solo, quer às variáveis socioeconómicas, usou-se o Método das Componentes Principais para a extração dos fatores, juntamente com o Critério de Kaiser (ou seja, consideraram-se apenas os fatores com eigenvalue ou valor próprio superior a 1). Para a rotação dos fatores, utilizou-se o método Varimax, uma vez que se pretende obter uma estrutura de fatores em que cada variável está fortemente associada a apenas um fator, e porque não se suspeita da existência de algum fator geral. Nas tabelas dos loadings de cada fator, são apresentados apenas os loadings de valor superior a 0,5, por ser este o valor mínimo para serem considerados como significantes (de facto, para a amostra em análise, um loading de 0,4 já poderia ser considerado aceitável). Por fim, para cálculo das variáveis a usar na regressão linear, usou-se o Método de Thompson (ou método da regressão). 3.1. VARIÁVEIS DE USO DO SOLO Como visto no Capítulo 2, as variáveis de uso do solo testadas foram:  AcTC_TI5;  LNDENS_GL;  PPESSGL1000;  PPGLOB400BUS;  KMVIA/PESSGL;  COMP;  ENTROP;  MIX;  PPGLOB400TCSP;  DISTCBD;  PAURB. 1ª Iteração Correu-se a análise fatorial do SPSS® para estas variáveis (cuja descrição se apresenta na Figura 3.1) e extraíram-se os diversos outputs, que se apresentam e caracterizam de seguida. Figura 3.1 – Estatística descritiva da 1ª iteração das variáveis de uso do solo
  9. 9. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 7 Na Figura 3.2 é apresentado o KMO, bem como o teste de Esfericidade de Bartlett. Neste caso, o KMO atinge um valor de 0,871, o que faz com que a análise fatorial seja fortemente recomendada. Por sua vez, a título indicativo, o teste de Esfericidade de Bartlett resulta num p-value inferior a 0,001, como seria desejável. Figura 3.2 – KMO e teste de Esfericidade de Bartlett da 1ª iteração das variáveis de uso do solo Olhando agora para a diagonal principal da matriz de anti-imagem das correlações (vide Figura 3.3) de modo a obter a MSA para cada uma das variáveis, é observável que todos os valores são superiores a 0,5, atestando a adequação de todas as variáveis. Figura 3.3 – Matrizes de anti-imagem da 1ª iteração das variáveis de uso do solo O passo seguinte passa pela análise das comunalidades de cada variável, que se apresentam na Figura 3.4. Como se observa, a percentagem da variância de cada variável explicada pelos fatores comuns extraídos pelo Método das Componentes Principais é sempre superior a 0,5.
  10. 10. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 8 Figura 3.4 – Comunalidades da 1ª iteração das variáveis de uso do solo Por sua vez, a Figura 3.5 representa a percentagem de variância explicada por cada um dos fatores. Como se observa, são retidos três fatores que explicam cerca de 72% da variabilidade total. Isso pode também ser confirmado pelo “scree plot” (Figura 3.6), que apresenta uma inflexão do terceiro para o quarto fator. Figura 3.5 – Variância total explicada pelos fatores da 1ª iteração das variáveis de uso do solo Figura 3.6 – “Scree plot” dos fatores da 1ª iteração das variáveis de uso do solo Os pesos dos fatores (ou loadings) são apresentados na Figura 3.7 e na Figura 3.8 (antes e pós-rotação Varimax, respetivamente).
  11. 11. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 9 Figura 3.7 – Loadings dos fatores da 1ª iteração das variáveis de uso do solo antes da rotação Figura 3.8 – Loadings dos fatores da 1ª iteração das variáveis de uso do solo após a rotação Por fim, como forma de certificar a qualidade do modelo fatorial, foram calculados alguns dos índices adequados para o efeito, nomeadamente o GFI, o AGFI e o RMSR*, como se apresenta na Tabela 3.2, a partir da matriz dos resíduos (Figura 3.9). Tabela 3.2 – Índices de qualidade do modelo fatorial da 1ª iteração das variáveis de uso do solo GFI 0,88 AGFI 0,69 RMSR* 0,07
  12. 12. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 10 Figura 3.9 – Matriz dos resíduos da 1ª iteração das variáveis de uso do solo Quer o GFI, quer o seu valor ajustado AGFI (mais conservativo) assumem valores inferiores a 0,9, pelo que se considera que o modelo não se ajusta bem aos dados disponíveis. Por sua vez, o RMSR* é inferior a 0,1, pelo que o ajustamento, por este índice, já se pode considerar bom. Ainda assim, face aos dois primeiros indicadores, optou-se por uma nova iteração da análise fatorial, retirando a variável com a menor comunalidade: PPESSGL1000. 2ª Iteração Correndo novamente a análise fatorial com o novo conjunto de variáveis (vide Figura 3.10), confrontou-se os resultados obtidos com os pressupostos teóricos. Figura 3.10 – Estatística descritiva da 2ª iteração das variáveis de uso do solo O valor de KMO, desta feita, praticamente não se alterou face à iteração anterior, tendo o teste de Esfericidade de Bartlett resultado dentro dos valores pretendidos (p-value inferior a 0,001), como indica a Figura 3.11. Figura 3.11 – KMO e teste de Esfericidade de Bartlett da 2ª iteração das variáveis de uso do solo
  13. 13. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 11 A matriz de anti-imagem obtida apresenta-se na Figura 3.12 e a sua diagonal principal (a MSA para cada variável) assume valores elevados (sempre superiores a 0,5), atestando a adequação de todas as variáveis. Figura 3.12 – Matrizes de anti-imagem da 2ª iteração das variáveis de uso do solo Da análise das comunalidades de cada variável (vide Figura 3.13) são percetíveis as elevadas percentagens de variância explicada (novamente sempre superiores a 0,5). Figura 3.13 – Comunalidades da 2ª iteração das variáveis de uso do solo A variância explicada por cada um dos fatores resulta, então, numa variância total explicada de 75% (3 fatores com valores próprios superiores a 1), como se apresenta na Figura 3.14 e no “scree plot” da Figura 3.15. Os loadings de cada fator, antes e depois da rotação dos fatores, apresentam-se, por sua vez, na Figura 3.16 e na Figura 3.17, respetivamente.
  14. 14. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 12 Figura 3.14 – Variância total explicada pelos fatores da 2ª iteração das variáveis de uso do solo Figura 3.15 – “Scree plot” dos fatores da 2ª iteração das variáveis de uso do solo Figura 3.16 – Loadings dos fatores da 2ª iteração das variáveis de uso do solo antes da rotação Figura 3.17 – Loadings dos fatores da 2ª iteração das variáveis de uso do solo após a rotação De modo a verificar novamente a adequabilidade do modelo, calculou-se o GFI, o AGFI e o RMSR* (vide Tabela 3.3) tendo como base a matriz dos resíduos (Figura 3.18). Tabela 3.3 – Índices de qualidade do modelo fatorial da 2ª iteração das variáveis de uso do solo GFI 0,91 AGFI 0,73 RMSR* 0,07
  15. 15. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 13 Figura 3.18 – Matriz dos resíduos da 2ª iteração das variáveis de uso do solo Desta feita, o GFI é superior a 0,9 e o RMSR* é superior a 0,1, pelo que o ajustamento se pode aceitar. Apesar de o AGFI ser inferior a 0,9, decidiu-se (uma vez que o GFI cumpre o pretendido) aceitar por enquanto esta solução de modelo de análise fatorial, já que estes fatores não são totalmente infalíveis. Note-se que se verificam algumas relações na Figura 3.17 que, à partida, seriam expectáveis:  Zonas com uma densidade elevada têm uma área urbanizada elevada e também uma alta percentagem de população a menos de 400 metros de uma paragem de autocarro (pois os operadores adequam a oferta à procura);  Zonas com elevada percentagem da população a menos de 400 metros dum transporte público pesado têm, tendencialmente, um índice de acessibilidade em transporte coletivo elevado. Dados os valores obtidos nos loadings, estes fatores do uso do solo passarão a ser denominados de:  Fator “Alto dos Moinhos” FAM (ou f1) – representa áreas fortemente urbanizadas, muito próximas do centro da cidade e com bom serviço de autocarros;  Fator “ferroviário” FF (ou f2) – descreve as zonas próximas de um transporte público pesado e com elevada acessibilidade de transporte público face ao transporte individual;  Fator de entropia FE (ou f3) – representa as zonas com forte entropia. Estes fatores, de acordo com a Figura 3.19, são dados por:
  16. 16. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 14 FAM = -0,040 x AcTC_TI5 + 0,195 x LNDENS_GL + 0,295 x PPGLOB400BUS – 0,212 x KMVIA/PESSGL – 0,265 x COMP – 0,069 x ENTROP – 0,230 x MIX – 0,116 x PPGLOB400TCSP + 0,175 x PAURB – 0,258 x DISTCBD FF = 0,356 x AcTC_TI5 + 0,020 x LNDENS_GL – 0,114 x PPGLOB400BUS + 0,180 x KMVIA/PESSGL + 0,057 x COMP + 0,006 x ENTROP + 0,521 x MIX + 0,420 x PPGLOB400TCSP + 0,030 x PAURB + 0,118 x DISTCBD FE = -0,088 x AcTC_TI5 – 0,002 x LNDENS_GL – 0,131 x PPGLOB400BUS – 0,344 x KMVIA/PESSGL + 0,471 x COMP + 0,687 x ENTROP + 0,038 x MIX – 0,013 x PPGLOB400TCSP + 0,041 x PAURB – 0,115 x DISTCBD Figura 3.19 – Coeficientes dos fatores das variáveis de uso do solo 3.2. VARIÁVEIS SOCIOECONÓMICAS Desta feita, as variáveis de caracterização socioeconómica da população de cada zona utilizadas na análise fatorial foram, numa primeira instância:  FAM>1TI;  TXANALF;  TXUNIV;  TX_SECT_I;  TX_SECT_III;  IPC;  TX_MOT;  PFAM0EMP;  PFAM1EMP;  PFAM2EMP;  PFAM0LIB;  PFAMCRIANC;  DIMGLOB. 1ª Iteração Recorrendo ao SPSS®, correu-se pela primeira vez a construção do modelo de análise fatorial, com as variáveis descritas (Figura 3.20).
  17. 17. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 15 Figura 3.20 – Estatística descritiva da 1ª iteração das variáveis socioeconómicas No entanto, apesar de anteriormente já se ter eliminado algumas das variáveis da análise por serem uma combinação linear de outras, a mensagem obtida na matriz das correlações – “a matriz não é positiva definida” ou, dito de outra forma, a matriz é singular e não admite uma matriz inversa (e o seu determinante é nulo) – denuncia a existência de uma variável que ainda é combinação linear de outra(s). Como resultado, as matrizes de anti-imagem e o KMO não são calculados. Olhando para as variáveis disponíveis, optou-se, na 2ª iteração, pela eliminação da TXUNIV, por se desconfiar da elevada relação com a variável TXANALF. 2ª Iteração Correndo novamente o modelo, já foi possível obter uma solução de análise fatorial. Nesta solução, o KMO obtido foi de 0,709 (vide Figura 3.21), que se encontra muito perto do limite inferior a partir do qual a adequação da análise fatorial é “média” (ou seja, pouco acima do “medíocre”). O teste de Esfericidade de Bartlett resulta num p-value inferior a 0,001, revelando que as variáveis estão correlacionadas significativamente. Figura 3.21 – KMO e teste de Esfericidade de Bartlett da 2ª iteração das variáveis socioeconómicas Já com a matriz de anti-imagem das correlações disponível (vide Figura 3.3) e olhando para a sua diagonal principal, registam-se valores MSA inferiores a 0,5 para as variáveis PFAM0EMP, PFAM1EMP e PFAM2EMP, o que revela que elas não se adequam à estrutura definida pelas restantes variáveis e, por isso, deve ser considerada a sua eliminação da análise fatorial.
  18. 18. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 16 Figura 3.22 – Matrizes de anti-imagem da 2ª iteração das variáveis socioeconómicas Por sua vez, olhando para as comunalidades das diversas variáveis (vide Figura 3.23), regista-se igualmente a presença de uma delas com uma percentagem de variância explicada inferior a 50% (DIMGLOB). Figura 3.23 – Comunalidades da 2ª iteração das variáveis socioeconómicas Considerou-se, por isso, a passagem para uma nova iteração do modelo, já com a eliminação destas 4 variáveis que não cumprem as pretensões da análise (PFAM0EMP, PFAM1EMP, PFAM2EMP e DIMGLOB). 3ª Iteração Já com um número mais reduzido de variáveis (Figura 3.24), correu-se novamente o modelo de análise fatorial. Figura 3.24 – Estatística descritiva da 3ª iteração das variáveis socioeconómicas Nesta iteração, o valor do KMO foi substancialmente mais elevado (por eliminação das
  19. 19. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 17 variáveis com fraca adequação), como se apresenta na Figura 3.25. Uma vez mais, o teste de Esfericidade de Bartlett resultou num p-value inferior a 0,001. Figura 3.25 – KMO e teste de Esfericidade de Bartlett da 3ª iteração das variáveis socioeconómicas Inspecionando a diagonal principal da nova matriz de anti-imagem das correlações (vide Figura 3.26), todas as variáveis apresentam valores de MSA muito satisfatórios. As comunalidades destas variáveis, por sua vez, também são sempre superiores a 0,5, como se observa na Figura 3.27. Figura 3.26 – Matrizes de anti-imagem da 3ª iteração das variáveis socioeconómicas Figura 3.27 – Comunalidades da 3ª iteração das variáveis socioeconómicas Na Figura 3.28, apresenta-se a variância explicada pelos fatores com valores próprios superiores a 1: é explicada quase 79% da variância total através de dois fatores, como também se pode observar pelo “scree plot” da Figura 3.29.
  20. 20. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 18 Figura 3.28 – Variância total explicada pelos fatores da 3ª iteração das variáveis socioeconómicas Figura 3.29 – “Scree plot” dos fatores da 3ª iteração das variáveis socioeconómicas Neste momento, procedeu-se de imediato ao cálculo dos índices de certificação da qualidade do modelo fatorial, que se apresentam na Tabela 3.4, a partir da matriz dos resíduos (Figura 3.30). Tabela 3.4 – Índices de qualidade do modelo fatorial da 3ª iteração das variáveis socioeconómicas GFI 0,98 AGFI 0,94 RMSR* 0,09 Figura 3.30 – Matriz dos resíduos da 3ª iteração das variáveis socioeconómicas
  21. 21. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 19 Tanto o GFI como o AGFI são superiores a 0,9, pelo que se pode considerar que o modelo se ajusta bem aos dados disponíveis. Por sua vez, o RMSR* é inferior a 0,1 mas muito próximo desse valor, a partir do qual se considera que o ajustamento é inaceitável. Deste modo, como forma de tentar evitar alguns dos valores das comunalidades mais baixos, não se aceitou esta solução do modelo fatorial e procedeu-se a uma nova iteração, testando alternativamente a eliminação de uma ou mais do conjunto de variáveis FAM>1TI, TXMOT, PFAM0LIB e PFAMCRIANC – efetivamente, para a 4ª iteração, acabaram por ser eliminadas as duas primeiras destas quatro. 4ª Iteração Correndo o modelo de análise fatorial agora com apenas as seis variáveis que restaram das análises anteriores (vide Figura 3.31), efetuaram-se as verificações habituais. Figura 3.31 – Estatística descritiva da 4ª iteração das variáveis socioeconómicas Nesta nova iteração, o valor do KMO subiu um pouco, verificando-se novamente os pressupostos inerentes ao teste de Esfericidade de Bartlett (p- value inferior a 0,001), como se verifica na Figura 3.32. Figura 3.32 – KMO e teste de Esfericidade de Bartlett da 4ª iteração das variáveis socioeconómicas Neste caso, a diagonal principal da matriz de anti- imagem das correlações (Figura 3.33) apresenta alguns valores de MSA mais baixos que a anterior, mas ainda assim, na globalidade verifica-se a adequação de todas as variáveis (como, aliás, o KMO já indiciava).
  22. 22. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 20 Figura 3.33 – Matrizes de anti-imagem da 4ª iteração das variáveis socioeconómicas As comunalidades das variáveis, desta vez, apresentam valores muito superiores a 0,5, como se observa na Figura 3.34. A variância total explicada pelos fatores com valores próprios superiores a 1, que são dois (vide Figura 3.35 e “scree plot” da Figura 3.36), sobe agora para os 86%. Figura 3.34 – Comunalidades da 4ª iteração das variáveis socioeconómicas Figura 3.35 – Variância total explicada pelos fatores da 4ª iteração das variáveis socioeconómicas
  23. 23. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 21 Figura 3.36 – “Scree plot” dos fatores da 4ª iteração das variáveis socioeconómicas Na Figura 3.37 e Figura 3.38 são apresentados, por fim, os loadings antes e depois da rotação dos eixos do tipo Varimax, respetivamente, todos com valores muito elevados. Figura 3.37 – Loadings dos fatores da 4ª iteração das variáveis socioeconómicas antes da rotação Figura 3.38 – Loadings dos fatores da 4ª iteração das variáveis socioeconómicas após a rotação Averiguando a qualidade deste novo modelo fatorial, e a partir da matriz dos resíduos (vide Figura 3.39), verifica-se através de qualquer um dos três índices apresentados na Tabela 3.5 (GFI, AGFI e RMSR*) a boa adequabilidade do modelo aos dados existentes. Tabela 3.5 – Índices de qualidade do modelo fatorial da 4ª iteração das variáveis socioeconómicas GFI 0,99 AGFI 0,96 RMSR* 0,05
  24. 24. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 22 Figura 3.39 – Matriz dos resíduos da 4ª iteração das variáveis socioeconómicas Uma vez mais, os dois fatores revelam algumas relações de algum modo aceitáveis:  Zonas com elevada taxa de analfabetismo apresentam um índice de poder de compra muito reduzido e uma taxa de trabalhadores no setor primário muito elevada;  Famílias sem profissionais liberais (ou seja, com trabalhadores por conta de outrem) têm menos filhos. Assim, os fatores de caracterização socioeconómica passarão a ser denominados de:  Fator “Poor Farmer” FPF (f1) – representa os indivíduos com baixo poder de compra, níveis de literacia reduzidos e empregos do setor primário;  Fator “Yuppie Workaholics” FYW (f2) – descreve os típicos jovens sem independência financeira que trabalham por conta de outrem e adiam a paternidade. Estes fatores, de acordo com a Figura 3.40, são dados por: FPF = 0,305 x TXANALF + 0,270 x TX_SECT_I – 0,268 x TX_SECT_III – 0,306 x IPC + 0,124 x PFAM0LIB – 0,089 x PFAMCRIANC FYW = 0,087 x TXANALF + 0,032 x TX_SECT_I – 0,006 x TX_SECT_III – 0,091 x IPC + 0,568 x PFAM0LIB – 0,538 x PFAMCRIANC
  25. 25. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 23 Figura 3.40 – Coeficientes dos fatores das variáveis socioeconómicas
  26. 26. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 24 4. ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS De acordo com a bibliografia consultada, particularmente o modelo de Stead, Williams e Titheridge, os padrões de uso do solo estão intimamente relacionados com as características socioeconómicas (e ambos influenciam os padrões de mobilidade), sendo difícil separá-los claramente ou, dito de outra forma, categorizar determinada variável como sendo especificamente de uso do solo ou socioeconómica (vide Figura 4.1). Figura 4.1 – Modelo conceptual das interações entre padrões de mobilidade, padrões de uso do solo e características socioeconómicas Fonte: Stead, Williams e Titheridge, 2000 Desse modo, testou-se a construção de um modelo de análise fatorial sem separação das variáveis, tentando perceber se os resultados obtidos permitiam a sua utilização no modelo de regressão linear a construir. Como se referiu anteriormente, nem todas as variáveis foram usadas nesta análise fatorial (não se eliminaram apenas aquelas que se sabia serem combinações lineares de outras, mas também a variável TXUNIV, que se veio a descobrir durante as análises fatoriais anteriores). 1ª Iteração Recorrendo ao SPSS® e tomando as variáveis descritas (Figura 4.2) nesta análise fatorial, obtiveram-se os outputs necessários para a verificação da adequabilidade do modelo. Figura 4.2 – Estatística descritiva da 1ª iteração da análise fatorial sem categorização das variáveis
  27. 27. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 25 Nesta solução, obteve-se logo uma adequação da análise fatorial “boa”, uma vez que o KMO resultante foi de 0,858 (vide Figura 4.3). O teste de Esfericidade de Bartlett, como habitual, resultou num p-value inferior a 0,001. Figura 4.3 – KMO e teste de Esfericidade de Bartlett da 1ª iteração da análise fatorial sem categorização das variáveis Na matriz anti-imagem (apresentada na Figura 4.5), a diagonal principal apresenta alguns valores de MSA inferiores a 0,5, nomeadamente na variável PFAM1EMP, seguida de valores entre 0,5 e 0,6 nas variáveis PFAM0EMP e PFAM2EMP. Analisando as comunalidades (vide Figura 4.4), registam-se variâncias explicadas inferiores a 50% nas variáveis PPESSGL1000 e ENTROP, e uma variância explicada de menos de 55% pela variável DIMGLOB. Estas seis variáveis tornaram-se, por isso, nas “candidatas” à eliminação, tendo sido efetuada uma nova iteração para avaliar um novo modelo de análise fatorial. Figura 4.4 – Comunalidades da 1ª iteração da análise fatorial sem categorização das variáveis
  28. 28. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 26 Figura 4.5 – Matrizes de anti-imagem da 1ª iteração da análise fatorial sem categorização das variáveis
  29. 29. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 27 2ª Iteração A 2ª iteração foi realizada já com as variáveis anteriormente descritas retiradas do modelo de análise fatorial (vide Figura 4.6). Figura 4.6 – Estatística descritiva da 2ª iteração da análise fatorial sem categorização das variáveis Nesta iteração, o valor do KMO subiu ligeiramente, como se observa na Figura 4.7. O teste de Esfericidade de Bartlett resultou novamente num valor de p-value inferior a 0,001. Figura 4.7 – KMO e teste de Esfericidade de Bartlett da 2ª iteração da análise fatorial sem categorização das variáveis Da análise da matriz de anti-imagem (Figura 4.9) é percetível (como, aliás, o elevado KMO já indiciava) a alta adequação da análise fatorial efetuada pelas MSA elevadas. As comunalidades, desta vez, também são bastante superiores a 0,5 (e até a 0,7), pelo que não se espera, por aqui, eliminar qualquer uma das variáveis utilizadas (vide Figura 4.8). Figura 4.8 – Comunalidades da 2ª iteração da análise fatorial sem categorização das variáveis
  30. 30. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 28 Figura 4.9 – Matrizes de anti-imagem da 2ª iteração da análise fatorial sem categorização das variáveis
  31. 31. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 29 A variância total explicada pelos 4 fatores obtidos nesta análise fatorial (como indica a Figura 4.10 e a Figura 4.11), atinge os 80%, o que se considera muito satisfatório. Figura 4.10 – Variância total explicada pelos fatores da 2ª iteração da análise fatorial sem categorização das variáveis Figura 4.11 – “Scree plot” dos fatores da 2ª iteração da análise fatorial sem categorização das variáveis Os loadings de cada fator apresentam-se na Figura 4.12 e na Figura 4.13 (antes e depois da rotação do tipo Varimax, respetivamente). Figura 4.12 – Loadings dos fatores da 2ª iteração da análise fatorial sem categorização das variáveis antes da rotação
  32. 32. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 30 Figura 4.13 – Loadings dos fatores da 2ª iteração da análise fatorial sem categorização das variáveis após a rotação A partir da matriz dos resíduos (vide Figura 4.15), é possível calcular os indicadores da qualidade deste modelo de análise fatorial, que se apresentam na Tabela 4.1: todos eles cumprem os requisitos (GFI e AGFI superiores a 0,90 e RMSR* inferior a 0,10), pelo que se garante a boa adequabilidade do modelo aos dados existentes. Tabela 4.1 – Índices de qualidade do modelo fatorial da 2ª iteração da análise fatorial sem categorização das variáveis GFI 0,97 AGFI 0,93 RMSR* 0,05 Os fatores obtidos explicam algumas características latentes entre as várias variáveis, e foram denominados da seguinte forma:  Fator “Parque dos Príncipes” FPP (f1) – representa os indivíduos com elevado poder de compra, trabalhadores do setor terciário, com uma média densidade de urbanização mas taxa de rede viária baixa (zonas com muitos espaços verdes);  Fator “Portas de Benfica” FPB (f2) – explica as zonas com média densidade de ocupação e um bom serviço de TC;  Fator “Baía de Cascais” FBC (f3) – representa as famílias com mais que uma viatura, alta taxa de motorização, e com profissionais liberais e crianças no agregado;  Fator “Instituto Superior Técnico” FIST (f4) – representa uma zona com boa acessibilidade de TC (nomeadamente transporte público pesado) e com uma relação de estudantes e trabalhadores alta face ao número de habitantes. Os coeficientes destes fatores apresentam-se na Figura 4.14. Figura 4.14 – Coeficientes dos fatores sem categorização das variáveis
  33. 33. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 31 Desta forma, os fatores tomam a forma que se segue: FPP = 0,076 x FAM>1TI – 0,101 x AcTC_TI5 + 0,013 x LNDENS_GL – 0,008 x PPGLOB400BUS – 0,210 x KMVIA/PESSGL – 0,261 x TXANALF – 0,239 x TX_SECT_I + 0,168 x TX_SECT_III + 0,273 x IPC + 0,034 x DEP_EMP_LX + 0,095 x TX_MOT + 0,152 x COMP – 0,035 x MIX – 0,042 x PPGLOB400TCSP – 0,064 x DISTCBD + 0,040 x PAURB – 0,074 x PFAM0LIB + 0,024 x PFAMCRIANC FPB = -0,104 x FAM>1TI – 0,008 x AcTC_TI5 + 0,127 x LNDENS_GL + 0,340 x PPGLOB400BUS + 0,106 x KMVIA/PESSGL + 0,123 x TXANALF + 0,131 x TX_SECT_I – 0,039 x TX_SECT_III – 0,070 x IPC + 0,157 x DEP_EMP_LX – 0,074 x TX_MOT – 0,518 x COMP – 0,279 x MIX – 0,079 x PPGLOB400TCSP – 0,164 x DISTCBD + 0,149 x PAURB – 0,111 x PFAM0LIB + 0,149 x PFAMCRIANC FBC = 0,248 x FAM>1TI – 0,034 x AcTC_TI5 + 0,000 x LNDENS_GL + 0,087 x PPGLOB400BUS + 0,035 x KMVIA/PESSGL – 0,063 x TXANALF + 0,013 x TX_SECT_I + 0,045 x TX_SECT_III + 0,097 x IPC + 0,056 x DEP_EMP_LX + 0,234 x TX_MOT – 0,070 x COMP + 0,012 x MIX + 0,082 x PPGLOB400TCSP – 0,023 x DISTCBD + 0,081 x PAURB – 0,439 x PFAM0LIB + 0,400 x PFAMCRIANC FIST = 0,043 x FAM>1TI + 0,321 x AcTC_TI5 + 0,049 x LNDENS_GL – 0,115 x PPGLOB400BUS + 0,042 x KMVIA/PESSGL + 0,020 x TXANALF + 0,054 x TX_SECT_I + 0,049 x TX_SECT_III – 0,079 x IPC + 0,041 x DEP_EMP_LX – 0,018 x TX_MOT + 0,197 x COMP + 0,523 x MIX + 0,398 x PPGLOB400TCSP + 0,059 x DISTCBD + 0,050 x PAURB – 0,042 x PFAM0LIB + 0,040 x PFAMCRIANC
  34. 34. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 32 Figura 4.15 – Matriz dos resíduos da 2ª iteração da análise fatorial sem categorização das variáveis
  35. 35. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 33 5. CONSTRUÇÃO DO MODELO DE REGRESSÃO LINEAR Uma vez que se realizaram dois conjuntos de análises fatoriais, proceder-se-á à averiguação de qual o modelo que melhor se ajusta aos dados disponíveis, desde que cumpra as verificações necessárias. Essas verificações explicam-se sucintamente de seguida:  Coeficiente de determinação (R²): medida de avaliação do efeito das variáveis independentes sobre a variável dependente, medindo a qualidade de ajustamento, e toma valores entre 0 e 1 (ou seja, um valor de 1,0 ou 100% representa que 100% da variabilidade total da variável dependente é explicada pelas variáveis independentes do modelo de regressão linear usado); de forma a poder comparar dois modelos com diferentes números de variáveis, deve calcular-se o coeficiente ajustado (R2 a);  Estatística de Durbin-Watson: este teste procura garantir que não existem correlações entre as variâncias – para tal, é exigido que o valor do teste seja o mais próximo possível de 2,0 (com uma amplitude de +- 0,2);  Verificação dos resíduos: procedimento gráfico cujo objetivo é garantir que os erros têm distribuição normal com média nula e variância constante (verificado através de um gráfico de probabilidade normal, com a probabilidade acumulada dos erros no eixo das abcissas e a probabilidade acumulada que se obteria caso os erros possuíssem realmente distribuição normal no eixo das ordenadas) e que são independentes; os erros dever-se-ão distribuir de forma linear em redor do zero de forma a garantir que são independentes e não se registam problemas de heteroscedasticidade;  Verificação da significância do modelo: trata-se de verificar se o p-value do teste ANOVA é inferior a 0,001, de modo a garantir que o modelo é altamente significativo;  Variance Inflation Factors (VIF): estes valores devem, para cada variável, ser inferiores a 5, sob pena de se estar perante problemas de multicolinearidade entre variáveis;  Condition Index: estes valores, por sua vez, devem ser inferiores a 15, novamente como forma de despiste de situações de multicolinearidade entre variáveis;  Valores centrados da influência de cada caso (Leverage) no ajustamento do modelo: segundo a bibliografia, os valores de Leverage devem situar-se abaixo de 0,2 (entre 0,2 e 0,5 consideram- se valores aceitáveis mas “arriscados”).
  36. 36. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 34 5.1. MODELO 1 – ANÁLISE FATORIAL COM CATEGORIZAÇÃO DAS VARIÁVEIS Das análises fatoriais separadas efetuadas para as variáveis de uso do solo e para as variáveis socioeconómicas, resultaram 5 fatores (agora transformados em 5 novas variáveis), a saber:  Fator “Alto dos Moinhos” FAM;  Fator “ferroviário” FF;  Fator de entropia FE;  Fator “Poor Farmer” FPF;  Fator “Yuppie Workaholics” FYW. 1ª Iteração Nesta 1ª iteração, além destas 5 variáveis calculadas a partir da análise fatorial, foram usadas ainda outras 3 variáveis que haviam ficado de fora nessa fase (vide Figura 5.1):  PTCDIST;  PPASSE;  DISTTIHAB. Figura 5.1 – Estatística descritiva da 1ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Um dos outputs mais úteis do SPSS® é apresentado na Figura 5.2, que resume alguns dos indicadores do modelo testado. Figura 5.2 – Resumo da 1ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Como se observa, o R2 obtido é de 0,684 (ou 0,671, considerando o ajustamento), o que não é de menosprezar, mas a estatística de Durbin- Watson resulta num valor de 1,644, fora do intervalo pretendido. Desse modo, procedeu-se desde logo a uma revisão das variáveis utilizadas, através do teste de eliminação das variáveis complementares às resultantes das análises fatoriais. Testou-se, alternativamente, a eliminação das variáveis PTCDIST, PPASSE e DISTTIHAB, tendo-se optado por manter apenas as duas últimas
  37. 37. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 35 2ª Iteração Correu-se, então, o modelo de regressão linear retirando a variável PTCDIST (vide Figura 5.3). Figura 5.3 – Estatística descritiva da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Olhando para o resumo do modelo dado pelo SPSS®, que se apresenta na Figura 5.4, é percetível a forte subida do valor do teste de Durbin-Watson, tendo contudo o R2 (e o seu valor ajustado) descido também com alguma expressão. Figura 5.4 – Resumo da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Olhando para os gráficos dos resíduos, conclui-se o seguinte:  Os resíduos têm distribuição normal com média nula e variância constante (vide Figura 5.5, para a representação do histograma, ou a Figura 5.6, para o normal probability plot, em que os pontos se distribuem aproximadamente sobre a diagonal principal);  Os resíduos distribuem-se de forma aparentemente aleatória em torno do eixo horizontal (ei = 0), o que garante a sua independência (Figura 5.7) e a homoscedasticidade das variáveis. Figura 5.5 – Histograma dos resíduos da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis)
  38. 38. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 36 Figura 5.6 – Normal probability plot da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Figura 5.7 – Gráfico da distribuição dos erros da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Pelo teste da ANOVA (Figura 5.8), o p-value é inferior a 0,001, pelo que o modelo de regressão linear tem significado para qualquer nível de significância. Figura 5.8 – Teste da ANOVA da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Por sua vez, da análise da Figura 5.9 constata-se que os VIF de todas as variáveis são inferiores a 5. Da Figura 5.10 percebe-se igualmente que os condition index de todas as variáveis são inferiores a 15, pelo que está garantida a não existência de problemas de multicolinearidade entre variáveis. Figura 5.9 – Coeficientes e VIF da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis)
  39. 39. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 37 Figura 5.10 – Verificação de multicolinearidade da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Olhando, por fim, para o valor da Leverage (valores centrados da influência de cada caso no ajustamento do modelo), que se apresenta na Figura 5.11, verifica-se que esta toma um valor máximo de 0,282, o que se pode considerar “arriscado” – de algum modo, pode significar a presença de um outlier. Figura 5.11 – Verificação da Leverage da 2ª iteração do modelo de regressão linear (análise fatorial com categorização das variáveis) Pela Figura 5.9 apresentada é ainda possível retirar os coeficientes do modelo de regressão linear construído. Uma primeira conclusão (retirada da coluna dos coeficientes estandardizados) é que o modelo passa pela origem (a ordenada na origem passa é zero). Por outro lado, os maiores coeficientes são das variáveis DISTTIHAB e PPASSE (variáveis de mobilidade, o que seria de esperar), seguida da variável FYW e são também as que têm p-values (significâncias) mais pequenas. Os coeficientes do modelo ajustado são, então, dados pela coluna dos coeficientes não estandardizados: PTIDIST = 0,395 + 0,013 x FAM – 0,014 x FF – 0,008 x FE – 0,011 x FPF – 0,021 x FYW + 0,017 x DISTTIHAB – 0,340 x PPASSE Neste modelo, são percetíveis as seguintes conclusões:  Alguns dos fatores relativos ao uso do solo apresentam sinal positivo (nomeadamente o fator FAM, que está relacionado com uma alta urbanização), enquanto outros apresentam uma influência negativa na parcela de viagens em TI (os que evidenciam a existência de
  40. 40. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 38 transporte coletivo pesado e a entropia da zona);  Quanto aos fatores socioeconómicos, verifica-se que quanto menor a “terciarização” da população, menor a distância percorrida em TI;  Os sinais obtidos no modelo de regressão linear para as variáveis de mobilidade também parecem estar suficientemente reais, uma vez que a distância relativa percorrida em TI aumenta com a distância absoluta e diminui com a posse de passe. Eliminação de Outliers De forma a tentar melhor a adequabilidade do modelo de regressão linear aos dados, realizou-se o diagnóstico disponível no SPSS® para deteção de outliers na base de dados. Os vários indicadores do modelo de regressão linear (Durbin-Watson, R2, etc.), praticamente não sofreram alterações, apesar de serem encontrados outliers a uma distância de mais de 3 desvios padrões da média da variável respetiva, pelo que não se apresentou a análise efetuada nesse sentido. 5.2. MODELO 2 – ANÁLISE FATORIAL SEM CATEGORIZAÇÃO DAS VARIÁVEIS A partir da análise fatorial sem categorização das variáveis que se efetuou no Capítulo 4, testou-se o modelo de regressão linear, recorrendo às novas quatro variáveis criadas:  Fator “Parque dos Príncipes” FPP;  Fator “Portas de Benfica” FPB;  Fator “Baía de Cascais” FBC;  Fator “Instituto Superior Técnico” FIST. 1ª Iteração Nesta fase, além dessas quatro variáveis, utilizaram-se novamente as três variáveis de mobilidade que haviam ficado de fora da análise fatorial (vide Figura 5.12):  PTCDIST;  PPASSE;  DISTTIHAB. Figura 5.12 – Estatística descritiva da 1ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Através do resumo do modelo (Figura 5.13) é constatável a existência de um R2 ajustado com um valor já significativo (0,686) mas a resposta ao teste de Durbin-Watson não passou de 1,704. Assim, procurou realizar-se uma 2ª iteração, através de novo teste de eliminação de alguma(s) das variáveis de mobilidade, tendo-se finalizado novamente com a eliminação da variável PTCDIST.
  41. 41. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 39 Figura 5.13 – Resumo da 1ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) 2ª Iteração O novo modelo de regressão linear (sem a variável PTCDIST, como indica a Figura 5.14) foi analisado pelos procedimentos disponíveis no SPSS®. Figura 5.14 – Estatística descritiva da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) O resumo do modelo (vide Figura 5.15), desta feita, demonstra um teste de Durbin-Watson com um valor já dentro do aceitável (1,931), ou seja, não se verificam correlações entre as variâncias das variáveis, tendo o R2 ajustado descido para 0,628. Figura 5.15 – Resumo da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Olhando para os gráficos dos resíduos deste novo modelo de regressão linear, podem ser retiradas as seguintes conclusões:  Os resíduos têm distribuição normal com média nula e variância constante (vide Figura 5.16, que apresenta o histograma, ou a Figura 5.17, com o normal probability plot, em que os pontos se distribuem aproximadamente sobre a diagonal principal);  Os resíduos distribuem-se de forma aparentemente aleatória em torno do eixo horizontal (ei = 0), garantindo a sua
  42. 42. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 40 independência (Figura 5.18) e homoscedasticidade. Figura 5.16 – Histograma dos resíduos da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Figura 5.17 – Normal probability plot da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Figura 5.18 – Gráfico da distribuição dos erros da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) O teste da ANOVA para este novo modelo (Figura 5.19) resulta num p-value novamente inferior a 0,001, concluindo-se que o modelo de regressão linear é significativo para qualquer nível de significância. Figura 5.19 – Teste da ANOVA da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) A Figura 5.20 permite verificar que os VIF para todas as variáveis são inferiores a 5, o mesmo enquanto os condition índex (vide Figura 5.21) são inferiores a 15, confirmando que não se registam problemas de multicolinearidade entre variáveis.
  43. 43. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 41 Figura 5.20 – Coeficientes e VIF da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Figura 5.21 – Verificação de multicolinearidade da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) A confirmação final do valor da Leverage (vide Figura 5.22) permite perceber que, neste modelo, se regista um valor máximo de 0,264, o que, tal como no outro modelo testado, se pode considerar “arriscado” (uma vez que a base de dados é a mesma, são naturais os indícios da presença de um outlier). Figura 5.22 – Verificação da Leverage da 2ª iteração do modelo de regressão linear (análise fatorial sem categorização das variáveis) Regressando à Figura 5.20, verifica-se novamente que o modelo passa pela origem (considerando os coeficientes estandardizados). Além disso, registam-se novamente coeficientes superiores nas variáveis de mobilidade (DISTTIHAB e PPASSE, com especial incidência para a primeira, como não é de estranhar), sendo as variáveis com p-values (significâncias) mais pequenas, seguidas da variável FBC. Pode, por fim, escrever-se a expressão do modelo de regressão linear a partir da coluna dos coeficientes não estandardizados:
  44. 44. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 42 PTIDIST = 0,390 + 0,010 x FPP + 0,015 x FPB + 0,027 x FBC – 0,015 x FIST + 0,017 x DISTTIHAB – 0,301 x PPASSE Olhando para a expressão resultante, os coeficientes obtidos parecem, em grande parte dos casos, apresentar alguns valores compreensíveis, apesar de ser menos intuitiva a sua explicação:  Quanto maior o poder de compra (representado pela variável FPP), maior a distância relativa percorrida em TI;  A relação entre a variável que representa a elevada taxa de motorização e até a posse de um maior número de viaturas (FBC) é positiva;  A relação entre uma variável representativa de boa acessibilidade de TC (FIST) e a distância relativa em TI tem sinal negativo;  Em contrapartida, o sinal do coeficiente da variável FPB é de mais difícil interpretação, uma vez que um bom serviço de transporte coletivo (pelo menos como sucederia nas zonas que esta variável/fator representa) deveria induzir a uma menor distância percorrida em transporte individual. Eliminação de Outliers Uma vez mais, tentou fazer-se o diagnóstico da existência de outliers nos dados disponíveis. Contudo, tal como no outro modelo de regressão linear, não se alteraram significativamente os indicadores do modelo (alterações apenas na terceira casa decimal), pelo que se optou pela sua exclusão deste relatório.
  45. 45. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 43 6. CONSIDERAÇÕES FINAIS Os dois modelos de regressão linear que se obtiveram parecem explicar de forma aceitável ou, pelo menos, com suficiente razoabilidade, a relação entre a distância relativa percorrida em TI com as variáveis independentes usadas. Analisando comparativamente estes modelos e as análises fatoriais que lhes dão origem, observa-se que:  O modelo de regressão linear feito sem categorização das variáveis (Modelo 2) tem um teste de Durbin-Watson superior e um R2 a ligeiramente superior ao do modelo em que se realizou a separação das variáveis (Modelo 1), cumprindo ambos as restantes verificações efetuadas – deste modo, considera-se esse modelo como mais ajustado aos dados e como mais explicativo da relação entre a distância relativa percorrida em TI e as diferentes variáveis utilizadas;  Por si só, o facto de o Modelo 1 ter pegado em variáveis separadamente torna-o menos robusto que o Modelo 2, em que o próprio modelo de análise fatorial, na construção dos fatores, faz essa separação;  Por um lado, julga-se que os fatores obtidos no Modelo 1 explicam melhor as variáveis, pelo menos em termos de relação entre as variáveis de cada fator – o facto de no Modelo 2 se terem poucos fatores que tentam explicar um grande número de variáveis torna-as menos intuitivas na interpretação;  Por outro lado, o Modelo 1 pode vir a sofrer de um processo de “garbage in garbage out”, ou seja, depende mais passos intermédios, podendo falhar logo de início numa errada categorização das variáveis; além disso, neste caso em particular, as próprias análises fatoriais que originam o Modelo 1 têm valores de KMO inferiores, e uma delas (a análise fatorial considerando as variáveis de uso do solo) tem um AGFI inferior a 0,90. Assim, entende-se que o Modelo 2 é o que apresenta uma maior robustez na explicação dos resultados: PTIDIST = 0,390 + 0,010 x FPP + 0,015 x FPB + 0,027 x FBC – 0,015 x FIST + 0,017 x DISTTIHAB – 0,301 x PPASSE De destacar que os coeficientes obtidos em cada um dos modelos são bastante semelhantes (particularmente, como se esperava, nas variáveis de mobilidade), ajudando a atestar a razoabilidade dos resultados. Além disso, essa semelhança dos resultados acaba por dar razão aos defensores de cada uma das teorias – quer aqueles que defendem a separação das variáveis, quer os que consideram que todas elas estão interligadas e não se devem categorizar separadamente
  46. 46. Técnicas de Apoio ao Planeamento de Transportes – MPOT IST-UTL André Ramos (n.º 76819) / Luís Neto (n.º 74776) 44 BIBLIOGRAFIA Livros  Maroco, J., “Análise Estatística com o SPSS Statistics” – 5ª edição, Report Number, 2011  Washington, Simon P., Karlaftis, Mathew G. e Mannering, “Statistical and Econometric Methods for Transportation Data Analysis”, Chapman & Hall/CRL, 2003 Publicações e Aulas  Abreu e Silva, J., “Repartição Modal e Usos do Solo – Construção de um Modelo Explicativo para a Área Metropolitana de Lisboa”, IST, 2005  Abreu e Silva, J., Slides das aulas teóricas de Técnicas de Apoio ao Planeamento de Transportes, IST, 2012

×