2. ANÁLISE DAS COMPONENTES PRINCIPAIS
Em muitos casos somos confrontados com um elevado número de variáveis
quantitativas, fortemente relacionadas entre si. Nestas condições é muito
importante conseguir reduzir o número de variáveis, substituindo as que
inicialmente existiam por outras que não estejam correlacionadas.
Um dos métodos mais utilizados para a redução do número de variáveis é a
análise de componentes principais
O método de extração das componentes principais é um procedimento
estatístico multivariado que permite transformar um conjunto de variáveis
quantitativas iniciais correlacionadas entre si (x1, x2, …xp) noutro conjunto de
menor número de variáveis não correlacionadas (ortogonais), designadas por
componentes principais (c1, c2, …., cp).
3. ANÁLISE DE
COMPONENTES
PRINCIPAIS
Considere o ficheiro
“Notas Alunos” que
apresenta os resultados de
35 alunos nas disciplinas
de matemática, física,
química, inglês, história,
francês, português e
biologia. Analise a sua
matriz das correlações.
Haverá componentes por
trás destas correlações?
4. ANÁLISE DE COMPONENTES PRINCIPAIS
X1
X2
X3
X4
Componente
1
Na análise de componentes
principais os itens formam o
componente. O componente
é então designado por
formativo.
As variáveis X1, X2, X3 e X4
podem ser substituídas pela
componente 1.
5. ANÁLISE DAS COMPONENTES PRINCIPAIS
O método das componentes principais pode ser
descrito como:
c1 = a11x1 + a12x2 + … + a1pxp
c2 = a21x1 + a22x2 + … + a2pxp
…
cp = ap1x1 + ap2x2 + … + appxp
Em que
As componentes principais são
calculadas por ordem decrescente de
importância, com a primeira a explicar
a variância máxima dos dados, a
segunda a traduzir a máxima variância
não explicada pela primeira e assim
sucessivamente.
𝑖=1
𝑝
𝑎𝑖𝑗
2
= 1 O SPSS apresenta os coeficientes
originais multiplicados pela raiz
quadrada da sua variância, para que
possam representar a correlação entre
as variáveis. Estes resultados
representam a matriz das correlações.
Desta forma elimina-se a interferência
das escalas de unidades.
A variância das componentes é
designada por “valores próprios”
(eigenvalues).
6. Retome o ficheiro das “Notas dos Alunos”:
O objetivo é reduzir o número de variáveis que podem caracterizar os alunos, definindo
variáveis independentes, latentes ou componentes, sem que tal se traduza numa
diminuição significativa da informação disponível.
Analyse /
analisar
Dimension reduction
/ redução da
dimensão
Factor / fator
7. ANÁLISE DAS COMPONENTES PRINCIPAIS
Transfira as
variáveis
independentes
para a caixa das
variáveis, deixando
apenas a nominal
que identifica o
aluno.
No menu Extração
selecione a opção
gráficos de escarpa
O SPSS pode levar a uma
interpretação errada que a
análise de componentes
principais é uma técnica de
análise fatorial, o que não
corresponde à realidade.
8. ANÁLISE DAS COMPONENTES PRINCIPAIS
Na tabela comunalidades surgem as variáveis
iniciais e o fator de extração, ou seja a
percentagem de variação retirada de cada
variável.
9. ANÁLISE DAS COMPONENTES PRINCIPAIS
Os resultados disponibilizam também a tabela da variância total explicada.
Note-se que são destacadas as duas componentes, que a percentagem de
explicação da 1.ª corresponde a 50,5%, a da 2.ª a 23,1%, o que perfaz um total
de 73,6%.
As duas componentes principais conseguem explicar 73,6% da variação dos
resultados das notas.
Porquê duas
componentes?
As
componentes
são
consideradas
desde que os
valores
próprios sejam
superiores a 1,
10. ANÁLISE DAS COMPONENTES PRINCIPAIS
Como só há 2
segmentos
com declive
acentuado,
significa que o
método extraiu
2 componentes
principais.
O gráfico de escarpa permite visualizar componentes extraídas.
Cada componente é representada por um segmento de reta: o 1.º tem um
declive muito acentuado; no 2.º o declive ainda é elevado mas menos acentuado
do que o anterior; no 3.º o segmento apresenta-se quase na horizontal
Analise-se a matriz das componentes:
- A componente 1 apresenta cargas “loadings” muito semelhantes entre si, todas elas
positivas
- A componente 2 tem cargas negativas nas disciplinas de matemática, física, química e
biologia.
É a componente 2 a destacar as disciplinas de matemática, física, química e biologia das
restantes.