SlideShare uma empresa Scribd logo
1 de 29
Baixar para ler offline
Análise Multivariada e Aprendizado Não-Supervisionado
Aula 0: Motivação - Análise de Componentes Principais
Prof. Cibele Russo
cibele@icmc.usp.br
http://www.icmc.usp.br/~cibele
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 1 / 22
Análise Multivariada
Análise Multivariada é um ramo da estatística que busca estudar e
desenvolver métodos para descrever e analisar dados multivariados.
Alguns objetivos específicos das técnicas de análise multivariada são
Redução ou simplificação dos dados
Ordenação e agrupamento dos dados
Investigação da dependência entre variáveis
Predição
Testes de hipóteses
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 2 / 22
Aprendizado estatístico
Alguns exemplos de aprendizado estatístico:
Predizer se um paciente, hospitalizado por um ataque cardíaco,
terá um segundo ataque cardíaco, a partir de medições clínicas,
dietéticas e demográficas do paciente.
Predizer o preço de uma ação daqui a seis meses, com base na
performance da companhia e de dados econômicos.
Identificar perfis de clientes a partir de dados do seu
relacionamento com uma empresa
... outros.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 3 / 22
Aprendizado supervisionado
Aprendizado supervisionado
Problemas em que existem um conjunto de variáveis explicativas
(inputs, preditores, variáveis independentes) e de variáveis
respostas (outputs, variáveis dependentes) são chamados de
problemas de aprendizado supervisionado.
Em problemas de aprendizado supervisionado, os dados possuem
rótulos (aprendem com um professor).
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 4 / 22
Aprendizado supervisionado
Algumas técnicas de aprendizado supervisionado:
Modelos de regressão linear,
Regressão logística,
Análise fatorial,
Análise discriminante linear (LDA).
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 5 / 22
Aprendizado não-supervisionado
Aprendizado não-supervisionado
Problemas em que se deseja estudar a variabilidade dos dados de
forma multivariada, possivelmente com redução de
dimensionalidade, sem necessariamente atribuir valores para uma
variável resposta, são chamados de problema de aprendizado
não-supervisionado.
Em problemas de aprendizado não-supervisionado, os dados não
possuem rótulos (não aprendem com um professor).
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 6 / 22
Aprendizado não-supervisionado
Algumas técnicas de aprendizado não-supervisionado:
Análise de componentes principais (PCA),
Análise de agrupamentos (Clustering): dendrograma, K-médias.
Análise de correlações canônicas (CCA)
Análise de correspondência (CA)
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 7 / 22
Análise multivariada
Distribuição normal bivariada
Fonte: https://towardsdatascience.com/a-python-tutorial-on-
generating-and-plotting-a-3d-guassian-distribution-8c6ec6c41d03
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 8 / 22
Aprendizado não-supervisionado
Aprendizado não-supervisionado: exemplo (K-médias)
Fonte: https://mubaris.com/posts/kmeans-clustering/
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 9 / 22
Aprendizado não-supervisionado
Aprendizado não-supervisionado: exemplo (dendrograma)
FM
FMRP
ESALQ
EP
FMVZ
FOB
ICB
IFSC
IF
IQ
FO
FFCLRP
FCF
ICMC
IQSC
IB
EEFE
0
500
1500 Dendrograma de Publicações
hclust (*, "ward")
Unidades USP
Distância
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 10 / 22
Introdução - Dados multivariados
X
e
é um vetor aleatório de dimensão p × 1, isto é,
X
e
=






X1
X2
.
.
.
Xp






,
em que cada Xi é uma variável aleatória com média µi e variância σ2
i ,
para i = 1, . . . , p.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 11 / 22
Introdução - Dados multivariados
A covariância e a correlação entre duas variáveis Xi e Xj, com
i, j = 1, . . . , p e i 6= j são dadas, respectivamente, por
Cov(Xi, Xj) = σij e Cor(Xi, Xj) = ρij.
Obs: ρij =
σij
q
σ2
i
q
σ2
j
.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 12 / 22
Introdução - Dados multivariados
O vetor de médias (populacionais) de X
e
é µ
e
p×1 e a matriz de
variâncias e covariâncias (populacionais) de X
e
é Σp×p, em que
µ
e
=






µ1
µ2
.
.
.
µp






e Σ =






σ2
1 σ12 . . . σ1p
σ2
2 . . . σ2p
...
.
.
.
sim. σ2
p






Obs: Note que Σ é simétrica pois Cov(Xi, Xj) = Cov(Xj, Xi), para
i, j = 1, . . . , p.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 13 / 22
Introdução - Dados multivariados
Estamos particularmente interessados no caso em que as variáveis
X1, . . . , Xp estão correlacionadas, isto é, algumas (ou muitas) das
covariâncias Cov(Xi, Xj), i, j = 1, . . . , p e i 6= j são não-nulas.
Quando isso ocorre, significa que existe redundância entre
dimensões, e podemos ter interesse em reduzir a dimensionalidade
do problema, construindo novas variáveis, não correlacionadas entre
si, que sejam combinações lineares das variáveis originais.
Pode ser que poucas (k) novas variáveis expliquem grande parte da
variabilidade existente nas (p) variáveis originais. Isso pode significar
a redução de custos como tempo computacional e espaço para
armazenamento de dados.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 14 / 22
Introdução - Dados multivariados
Estamos particularmente interessados no caso em que as variáveis
X1, . . . , Xp estão correlacionadas, isto é, algumas (ou muitas) das
covariâncias Cov(Xi, Xj), i, j = 1, . . . , p e i 6= j são não-nulas.
Quando isso ocorre, significa que existe redundância entre
dimensões, e podemos ter interesse em reduzir a dimensionalidade
do problema, construindo novas variáveis, não correlacionadas entre
si, que sejam combinações lineares das variáveis originais.
Pode ser que poucas (k) novas variáveis expliquem grande parte da
variabilidade existente nas (p) variáveis originais. Isso pode significar
a redução de custos como tempo computacional e espaço para
armazenamento de dados.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 14 / 22
Introdução - Dados multivariados
Estamos particularmente interessados no caso em que as variáveis
X1, . . . , Xp estão correlacionadas, isto é, algumas (ou muitas) das
covariâncias Cov(Xi, Xj), i, j = 1, . . . , p e i 6= j são não-nulas.
Quando isso ocorre, significa que existe redundância entre
dimensões, e podemos ter interesse em reduzir a dimensionalidade
do problema, construindo novas variáveis, não correlacionadas entre
si, que sejam combinações lineares das variáveis originais.
Pode ser que poucas (k) novas variáveis expliquem grande parte da
variabilidade existente nas (p) variáveis originais. Isso pode significar
a redução de custos como tempo computacional e espaço para
armazenamento de dados.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 14 / 22
Análise de Componentes principais
Seja X
e
um vetor aleatório com vetor de médias µ
e
e matriz de
variâncias e covariâncias Σ.
Sejam λ1 ≥ . . . ≥ λp os autovalores de Σ, com autovetores
correspondentes e
e
1, . . . , e
e
p, tais que
1 e
e
>
i e
e
j = 0, para i, j = 1, . . . , p e i 6= j,
2 e
e
>
i e
e
i = 1, para i = 1, . . . , p,
3 Σe
e
i = λie
e
i, para i = 1, . . . , p.
Considere a matriz ortogonal Op×p = (e
e
1, . . . , e
e
p)>. Então
Y
e
p×1 = O>X
e
é o vetor de componentes principais de Σ.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 15 / 22
Análise de Componentes principais
Seja X
e
um vetor aleatório com vetor de médias µ
e
e matriz de
variâncias e covariâncias Σ.
Sejam λ1 ≥ . . . ≥ λp os autovalores de Σ, com autovetores
correspondentes e
e
1, . . . , e
e
p, tais que
1 e
e
>
i e
e
j = 0, para i, j = 1, . . . , p e i 6= j,
2 e
e
>
i e
e
i = 1, para i = 1, . . . , p,
3 Σe
e
i = λie
e
i, para i = 1, . . . , p.
Considere a matriz ortogonal Op×p = (e
e
1, . . . , e
e
p)>. Então
Y
e
p×1 = O>X
e
é o vetor de componentes principais de Σ.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 15 / 22
Análise de Componentes principais
Seja X
e
um vetor aleatório com vetor de médias µ
e
e matriz de
variâncias e covariâncias Σ.
Sejam λ1 ≥ . . . ≥ λp os autovalores de Σ, com autovetores
correspondentes e
e
1, . . . , e
e
p, tais que
1 e
e
>
i e
e
j = 0, para i, j = 1, . . . , p e i 6= j,
2 e
e
>
i e
e
i = 1, para i = 1, . . . , p,
3 Σe
e
i = λie
e
i, para i = 1, . . . , p.
Considere a matriz ortogonal Op×p = (e
e
1, . . . , e
e
p)>. Então
Y
e
p×1 = O>X
e
é o vetor de componentes principais de Σ.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 15 / 22
Análise de Componentes principais
Seja X
e
um vetor aleatório com vetor de médias µ
e
e matriz de
variâncias e covariâncias Σ.
Sejam λ1 ≥ . . . ≥ λp os autovalores de Σ, com autovetores
correspondentes e
e
1, . . . , e
e
p, tais que
1 e
e
>
i e
e
j = 0, para i, j = 1, . . . , p e i 6= j,
2 e
e
>
i e
e
i = 1, para i = 1, . . . , p,
3 Σe
e
i = λie
e
i, para i = 1, . . . , p.
Considere a matriz ortogonal Op×p = (e
e
1, . . . , e
e
p)>. Então
Y
e
p×1 = O>X
e
é o vetor de componentes principais de Σ.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 15 / 22
Componentes principais
Propriedades:
1 A j-ésima componente principal de Σ é dada por
Yj = ej
e
>
X
e
.
2 E(Yj) = ej
e
>µ
e
.
3 Var(Yj) = ej
e
>Σej
e
= λj.
4 Cov(Yi, Yj) = Cor(Yi, Yj) = 0 para i, j = 1, . . . , p e i 6= j.
5 A proporção da variância total de X
e
que é explicada pela j-ésima
componente principal é
λj
Pp
i=1 λi
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 16 / 22
Componentes Principais
Observações:
1 Com a matriz de variâncias e covariâncias amostrais, estima-se
os componentes principais da matriz de variâncias e covariâncias
populacionais.
2 O mesmo desenvolvimento pode ser feito para a matriz de
correlações, com a vantagem de que as componentes principais
são menos influenciadas pela magnitude das variâncias.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 17 / 22
Componentes Principais
Observações:
1 Com a matriz de variâncias e covariâncias amostrais, estima-se
os componentes principais da matriz de variâncias e covariâncias
populacionais.
2 O mesmo desenvolvimento pode ser feito para a matriz de
correlações, com a vantagem de que as componentes principais
são menos influenciadas pela magnitude das variâncias.
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 17 / 22
Motivação 1
O conjunto de dados "Educação" (Fonte: Ipeadata) mostra dados
educacionais por estado de acordo com a descrição a seguir.
Sigla (do estado)
Estado
X1: Frequência escolar de pessoas com 7 a 14 anos
X2: Defasagem escolar em mais de 1 ano de atraso de pessoas
com 7 a 14 anos (2000)
X3: Anos de estudo de pessoas com 25 anos ou mais (2000)
X4: Analfabetos com 25 anos ou mais (2000)
X5: Evasão escolar de pessoas com 7 a 14 anos (2000)
X6: Evasão escolar de pessoas com 15 a 17 anos (2000)
X7: Frequência escolar de pessoas com 7 a 22 anos
Os comandos para análises se encontram no arquivo Motivação.ipynb
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 18 / 22
Matriz de correlações
Freq:7-14 Def. escolar Anos.est:25+ Analf.:25+ Ev:7-14 Ev:15-17 Freq:7-22
Freq:7-14 1.00 -0.64 0.51 -0.48 -1.00 -0.56 0.72
Defasagem escolar -0.64 1.00 -0.82 0.89 0.64 0.24 -0.50
Anos.estudo:25+ 0.51 -0.82 1.00 -0.90 -0.51 -0.50 0.59
Analfabetos:25+ -0.48 0.89 -0.90 1.00 0.48 0.23 -0.42
Evasão:7-14 -1.00 0.64 -0.51 0.48 1.00 0.56 -0.72
Evasao:15-17 -0.56 0.24 -0.50 0.23 0.56 1.00 -0.81
Freq:7-22 0.72 -0.50 0.59 -0.42 -0.72 -0.81 1.00
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 19 / 22
Gráfico de correlação
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
Freq:7-14
Defasagem
escolar
Anos.estudo:25+
Analfabetos:25+
Evasão:7-14
Evasao:15-17
Freq:7-22
Freq:7-14
Defasagem escolar
Anos.estudo:25+
Analfabetos:25+
Evasão:7-14
Evasao:15-17
Freq:7-22
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 20 / 22
Perguntas
1 Deseja-se criar uma ordenação pela primeira componente
principal da matriz de variâncias e covariâncias.
2 Quanto da variabilidade total dos dados é explicado pela primeira
componente principai?
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 21 / 22
Motivação 2
Estudos mostram que grande parte de adultos e adolescentes
norte-americanos usam regularmente substâncias psicoativas. Em um
destes estudos (Huba et al. 1981, J. of Personality and Social
Psychology), dados foram coletados de 1634 estudantes na área
metropolitana de Los Angeles. Cada participante completou um
questionário informando o número de vezes que cada item foi usado.
Os itens são os seguintes: cigarro, cerveja, vinho, licor, cocaína,
tranquilizantes, medicamentos, heroína, maconha, haxixe, inalantes,
alucinógenos e anfetaminas.
Ver arquivo Motivação_R.ipynb .
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 22 / 22
Motivação 2
Estudos mostram que grande parte de adultos e adolescentes
norte-americanos usam regularmente substâncias psicoativas. Em um
destes estudos (Huba et al. 1981, J. of Personality and Social
Psychology), dados foram coletados de 1634 estudantes na área
metropolitana de Los Angeles. Cada participante completou um
questionário informando o número de vezes que cada item foi usado.
Os itens são os seguintes: cigarro, cerveja, vinho, licor, cocaína,
tranquilizantes, medicamentos, heroína, maconha, haxixe, inalantes,
alucinógenos e anfetaminas.
Ver arquivo Motivação_R.ipynb .
Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 22 / 22

Mais conteúdo relacionado

Semelhante a Motivação_AulaAberta.pdf

Matemática aplicada à administração
Matemática aplicada à administraçãoMatemática aplicada à administração
Matemática aplicada à administraçãoCamila Santos
 
Analise de componentes principais
Analise de componentes principaisAnalise de componentes principais
Analise de componentes principaisTaís Kuster Moro
 
4426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-5514426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-551Jenifer Ferreira
 
Modelos lineares mistos aplicados em ciências atuariais.
Modelos lineares mistos aplicados em ciências atuariais.Modelos lineares mistos aplicados em ciências atuariais.
Modelos lineares mistos aplicados em ciências atuariais.Universidade Federal Fluminense
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
 
Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 diegogabandrade
 
áLgebra 1 vol1 - uff cederj
áLgebra 1   vol1 - uff cederjáLgebra 1   vol1 - uff cederj
áLgebra 1 vol1 - uff cederjCarlos Perez
 
Provete estatistica aplicada
Provete estatistica aplicadaProvete estatistica aplicada
Provete estatistica aplicadaJoel Pereira
 
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...Bowman Guimaraes
 
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...Bowman Guimaraes
 
Algebra linear I EAD
Algebra linear I EADAlgebra linear I EAD
Algebra linear I EADjhff
 

Semelhante a Motivação_AulaAberta.pdf (20)

Matemática aplicada à administração
Matemática aplicada à administraçãoMatemática aplicada à administração
Matemática aplicada à administração
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Analise de componentes principais
Analise de componentes principaisAnalise de componentes principais
Analise de componentes principais
 
Aula intro efeitos aleatorios
Aula intro efeitos aleatoriosAula intro efeitos aleatorios
Aula intro efeitos aleatorios
 
Efeitos aleatórios
Efeitos aleatóriosEfeitos aleatórios
Efeitos aleatórios
 
4426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-5514426477 matematica-e-realidade-aula-08-551
4426477 matematica-e-realidade-aula-08-551
 
Capitulo1
Capitulo1Capitulo1
Capitulo1
 
Plano de Aula P.A. CAp
Plano de Aula P.A. CApPlano de Aula P.A. CAp
Plano de Aula P.A. CAp
 
Apostila etec estatistica
Apostila etec estatisticaApostila etec estatistica
Apostila etec estatistica
 
Aula 00
Aula 00Aula 00
Aula 00
 
Modelos lineares mistos aplicados em ciências atuariais.
Modelos lineares mistos aplicados em ciências atuariais.Modelos lineares mistos aplicados em ciências atuariais.
Modelos lineares mistos aplicados em ciências atuariais.
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4
 
1657631627830.pdf
1657631627830.pdf1657631627830.pdf
1657631627830.pdf
 
áLgebra 1 vol1 - uff cederj
áLgebra 1   vol1 - uff cederjáLgebra 1   vol1 - uff cederj
áLgebra 1 vol1 - uff cederj
 
topico 2_Medidas descritivas.pdf
topico 2_Medidas descritivas.pdftopico 2_Medidas descritivas.pdf
topico 2_Medidas descritivas.pdf
 
Provete estatistica aplicada
Provete estatistica aplicadaProvete estatistica aplicada
Provete estatistica aplicada
 
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
 
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
Pessoal.utfpr.edu.br heidemann arquivos_apostilade_precalculodiferencialeinte...
 
Algebra linear I EAD
Algebra linear I EADAlgebra linear I EAD
Algebra linear I EAD
 

Último

PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...azulassessoria9
 
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...azulassessoria9
 
Historia da Arte europeia e não só. .pdf
Historia da Arte europeia e não só. .pdfHistoria da Arte europeia e não só. .pdf
Historia da Arte europeia e não só. .pdfEmanuel Pio
 
About Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de HotéisAbout Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de Hotéisines09cachapa
 
Construção (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! SertãConstrução (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! SertãIlda Bicacro
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...licinioBorges
 
Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Ilda Bicacro
 
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕESCOMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕESEduardaReis50
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelGilber Rubim Rangel
 
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdfLeloIurk1
 
Atividade - Letra da música Esperando na Janela.
Atividade -  Letra da música Esperando na Janela.Atividade -  Letra da música Esperando na Janela.
Atividade - Letra da música Esperando na Janela.Mary Alvarenga
 
Ficha de trabalho com palavras- simples e complexas.pdf
Ficha de trabalho com palavras- simples e complexas.pdfFicha de trabalho com palavras- simples e complexas.pdf
Ficha de trabalho com palavras- simples e complexas.pdfFtimaMoreira35
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxLuizHenriquedeAlmeid6
 
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfplanejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfmaurocesarpaesalmeid
 
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdfENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdfLeloIurk1
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...azulassessoria9
 
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteCOMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteVanessaCavalcante37
 
Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Ilda Bicacro
 
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamentalAntônia marta Silvestre da Silva
 

Último (20)

PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
 
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
 
Historia da Arte europeia e não só. .pdf
Historia da Arte europeia e não só. .pdfHistoria da Arte europeia e não só. .pdf
Historia da Arte europeia e não só. .pdf
 
About Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de HotéisAbout Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de Hotéis
 
Construção (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! SertãConstrução (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! Sertã
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
 
Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!
 
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕESCOMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim Rangel
 
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
 
Atividade - Letra da música Esperando na Janela.
Atividade -  Letra da música Esperando na Janela.Atividade -  Letra da música Esperando na Janela.
Atividade - Letra da música Esperando na Janela.
 
Ficha de trabalho com palavras- simples e complexas.pdf
Ficha de trabalho com palavras- simples e complexas.pdfFicha de trabalho com palavras- simples e complexas.pdf
Ficha de trabalho com palavras- simples e complexas.pdf
 
Bullying, sai pra lá
Bullying,  sai pra láBullying,  sai pra lá
Bullying, sai pra lá
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
 
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfplanejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
 
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdfENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
 
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteCOMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
 
Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"
 
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
 

Motivação_AulaAberta.pdf

  • 1. Análise Multivariada e Aprendizado Não-Supervisionado Aula 0: Motivação - Análise de Componentes Principais Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 1 / 22
  • 2. Análise Multivariada Análise Multivariada é um ramo da estatística que busca estudar e desenvolver métodos para descrever e analisar dados multivariados. Alguns objetivos específicos das técnicas de análise multivariada são Redução ou simplificação dos dados Ordenação e agrupamento dos dados Investigação da dependência entre variáveis Predição Testes de hipóteses Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 2 / 22
  • 3. Aprendizado estatístico Alguns exemplos de aprendizado estatístico: Predizer se um paciente, hospitalizado por um ataque cardíaco, terá um segundo ataque cardíaco, a partir de medições clínicas, dietéticas e demográficas do paciente. Predizer o preço de uma ação daqui a seis meses, com base na performance da companhia e de dados econômicos. Identificar perfis de clientes a partir de dados do seu relacionamento com uma empresa ... outros. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 3 / 22
  • 4. Aprendizado supervisionado Aprendizado supervisionado Problemas em que existem um conjunto de variáveis explicativas (inputs, preditores, variáveis independentes) e de variáveis respostas (outputs, variáveis dependentes) são chamados de problemas de aprendizado supervisionado. Em problemas de aprendizado supervisionado, os dados possuem rótulos (aprendem com um professor). Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 4 / 22
  • 5. Aprendizado supervisionado Algumas técnicas de aprendizado supervisionado: Modelos de regressão linear, Regressão logística, Análise fatorial, Análise discriminante linear (LDA). Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 5 / 22
  • 6. Aprendizado não-supervisionado Aprendizado não-supervisionado Problemas em que se deseja estudar a variabilidade dos dados de forma multivariada, possivelmente com redução de dimensionalidade, sem necessariamente atribuir valores para uma variável resposta, são chamados de problema de aprendizado não-supervisionado. Em problemas de aprendizado não-supervisionado, os dados não possuem rótulos (não aprendem com um professor). Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 6 / 22
  • 7. Aprendizado não-supervisionado Algumas técnicas de aprendizado não-supervisionado: Análise de componentes principais (PCA), Análise de agrupamentos (Clustering): dendrograma, K-médias. Análise de correlações canônicas (CCA) Análise de correspondência (CA) Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 7 / 22
  • 8. Análise multivariada Distribuição normal bivariada Fonte: https://towardsdatascience.com/a-python-tutorial-on- generating-and-plotting-a-3d-guassian-distribution-8c6ec6c41d03 Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 8 / 22
  • 9. Aprendizado não-supervisionado Aprendizado não-supervisionado: exemplo (K-médias) Fonte: https://mubaris.com/posts/kmeans-clustering/ Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 9 / 22
  • 10. Aprendizado não-supervisionado Aprendizado não-supervisionado: exemplo (dendrograma) FM FMRP ESALQ EP FMVZ FOB ICB IFSC IF IQ FO FFCLRP FCF ICMC IQSC IB EEFE 0 500 1500 Dendrograma de Publicações hclust (*, "ward") Unidades USP Distância Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 10 / 22
  • 11. Introdução - Dados multivariados X e é um vetor aleatório de dimensão p × 1, isto é, X e =       X1 X2 . . . Xp       , em que cada Xi é uma variável aleatória com média µi e variância σ2 i , para i = 1, . . . , p. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 11 / 22
  • 12. Introdução - Dados multivariados A covariância e a correlação entre duas variáveis Xi e Xj, com i, j = 1, . . . , p e i 6= j são dadas, respectivamente, por Cov(Xi, Xj) = σij e Cor(Xi, Xj) = ρij. Obs: ρij = σij q σ2 i q σ2 j . Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 12 / 22
  • 13. Introdução - Dados multivariados O vetor de médias (populacionais) de X e é µ e p×1 e a matriz de variâncias e covariâncias (populacionais) de X e é Σp×p, em que µ e =       µ1 µ2 . . . µp       e Σ =       σ2 1 σ12 . . . σ1p σ2 2 . . . σ2p ... . . . sim. σ2 p       Obs: Note que Σ é simétrica pois Cov(Xi, Xj) = Cov(Xj, Xi), para i, j = 1, . . . , p. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 13 / 22
  • 14. Introdução - Dados multivariados Estamos particularmente interessados no caso em que as variáveis X1, . . . , Xp estão correlacionadas, isto é, algumas (ou muitas) das covariâncias Cov(Xi, Xj), i, j = 1, . . . , p e i 6= j são não-nulas. Quando isso ocorre, significa que existe redundância entre dimensões, e podemos ter interesse em reduzir a dimensionalidade do problema, construindo novas variáveis, não correlacionadas entre si, que sejam combinações lineares das variáveis originais. Pode ser que poucas (k) novas variáveis expliquem grande parte da variabilidade existente nas (p) variáveis originais. Isso pode significar a redução de custos como tempo computacional e espaço para armazenamento de dados. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 14 / 22
  • 15. Introdução - Dados multivariados Estamos particularmente interessados no caso em que as variáveis X1, . . . , Xp estão correlacionadas, isto é, algumas (ou muitas) das covariâncias Cov(Xi, Xj), i, j = 1, . . . , p e i 6= j são não-nulas. Quando isso ocorre, significa que existe redundância entre dimensões, e podemos ter interesse em reduzir a dimensionalidade do problema, construindo novas variáveis, não correlacionadas entre si, que sejam combinações lineares das variáveis originais. Pode ser que poucas (k) novas variáveis expliquem grande parte da variabilidade existente nas (p) variáveis originais. Isso pode significar a redução de custos como tempo computacional e espaço para armazenamento de dados. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 14 / 22
  • 16. Introdução - Dados multivariados Estamos particularmente interessados no caso em que as variáveis X1, . . . , Xp estão correlacionadas, isto é, algumas (ou muitas) das covariâncias Cov(Xi, Xj), i, j = 1, . . . , p e i 6= j são não-nulas. Quando isso ocorre, significa que existe redundância entre dimensões, e podemos ter interesse em reduzir a dimensionalidade do problema, construindo novas variáveis, não correlacionadas entre si, que sejam combinações lineares das variáveis originais. Pode ser que poucas (k) novas variáveis expliquem grande parte da variabilidade existente nas (p) variáveis originais. Isso pode significar a redução de custos como tempo computacional e espaço para armazenamento de dados. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 14 / 22
  • 17. Análise de Componentes principais Seja X e um vetor aleatório com vetor de médias µ e e matriz de variâncias e covariâncias Σ. Sejam λ1 ≥ . . . ≥ λp os autovalores de Σ, com autovetores correspondentes e e 1, . . . , e e p, tais que 1 e e > i e e j = 0, para i, j = 1, . . . , p e i 6= j, 2 e e > i e e i = 1, para i = 1, . . . , p, 3 Σe e i = λie e i, para i = 1, . . . , p. Considere a matriz ortogonal Op×p = (e e 1, . . . , e e p)>. Então Y e p×1 = O>X e é o vetor de componentes principais de Σ. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 15 / 22
  • 18. Análise de Componentes principais Seja X e um vetor aleatório com vetor de médias µ e e matriz de variâncias e covariâncias Σ. Sejam λ1 ≥ . . . ≥ λp os autovalores de Σ, com autovetores correspondentes e e 1, . . . , e e p, tais que 1 e e > i e e j = 0, para i, j = 1, . . . , p e i 6= j, 2 e e > i e e i = 1, para i = 1, . . . , p, 3 Σe e i = λie e i, para i = 1, . . . , p. Considere a matriz ortogonal Op×p = (e e 1, . . . , e e p)>. Então Y e p×1 = O>X e é o vetor de componentes principais de Σ. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 15 / 22
  • 19. Análise de Componentes principais Seja X e um vetor aleatório com vetor de médias µ e e matriz de variâncias e covariâncias Σ. Sejam λ1 ≥ . . . ≥ λp os autovalores de Σ, com autovetores correspondentes e e 1, . . . , e e p, tais que 1 e e > i e e j = 0, para i, j = 1, . . . , p e i 6= j, 2 e e > i e e i = 1, para i = 1, . . . , p, 3 Σe e i = λie e i, para i = 1, . . . , p. Considere a matriz ortogonal Op×p = (e e 1, . . . , e e p)>. Então Y e p×1 = O>X e é o vetor de componentes principais de Σ. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 15 / 22
  • 20. Análise de Componentes principais Seja X e um vetor aleatório com vetor de médias µ e e matriz de variâncias e covariâncias Σ. Sejam λ1 ≥ . . . ≥ λp os autovalores de Σ, com autovetores correspondentes e e 1, . . . , e e p, tais que 1 e e > i e e j = 0, para i, j = 1, . . . , p e i 6= j, 2 e e > i e e i = 1, para i = 1, . . . , p, 3 Σe e i = λie e i, para i = 1, . . . , p. Considere a matriz ortogonal Op×p = (e e 1, . . . , e e p)>. Então Y e p×1 = O>X e é o vetor de componentes principais de Σ. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 15 / 22
  • 21. Componentes principais Propriedades: 1 A j-ésima componente principal de Σ é dada por Yj = ej e > X e . 2 E(Yj) = ej e >µ e . 3 Var(Yj) = ej e >Σej e = λj. 4 Cov(Yi, Yj) = Cor(Yi, Yj) = 0 para i, j = 1, . . . , p e i 6= j. 5 A proporção da variância total de X e que é explicada pela j-ésima componente principal é λj Pp i=1 λi Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 16 / 22
  • 22. Componentes Principais Observações: 1 Com a matriz de variâncias e covariâncias amostrais, estima-se os componentes principais da matriz de variâncias e covariâncias populacionais. 2 O mesmo desenvolvimento pode ser feito para a matriz de correlações, com a vantagem de que as componentes principais são menos influenciadas pela magnitude das variâncias. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 17 / 22
  • 23. Componentes Principais Observações: 1 Com a matriz de variâncias e covariâncias amostrais, estima-se os componentes principais da matriz de variâncias e covariâncias populacionais. 2 O mesmo desenvolvimento pode ser feito para a matriz de correlações, com a vantagem de que as componentes principais são menos influenciadas pela magnitude das variâncias. Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 17 / 22
  • 24. Motivação 1 O conjunto de dados "Educação" (Fonte: Ipeadata) mostra dados educacionais por estado de acordo com a descrição a seguir. Sigla (do estado) Estado X1: Frequência escolar de pessoas com 7 a 14 anos X2: Defasagem escolar em mais de 1 ano de atraso de pessoas com 7 a 14 anos (2000) X3: Anos de estudo de pessoas com 25 anos ou mais (2000) X4: Analfabetos com 25 anos ou mais (2000) X5: Evasão escolar de pessoas com 7 a 14 anos (2000) X6: Evasão escolar de pessoas com 15 a 17 anos (2000) X7: Frequência escolar de pessoas com 7 a 22 anos Os comandos para análises se encontram no arquivo Motivação.ipynb Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 18 / 22
  • 25. Matriz de correlações Freq:7-14 Def. escolar Anos.est:25+ Analf.:25+ Ev:7-14 Ev:15-17 Freq:7-22 Freq:7-14 1.00 -0.64 0.51 -0.48 -1.00 -0.56 0.72 Defasagem escolar -0.64 1.00 -0.82 0.89 0.64 0.24 -0.50 Anos.estudo:25+ 0.51 -0.82 1.00 -0.90 -0.51 -0.50 0.59 Analfabetos:25+ -0.48 0.89 -0.90 1.00 0.48 0.23 -0.42 Evasão:7-14 -1.00 0.64 -0.51 0.48 1.00 0.56 -0.72 Evasao:15-17 -0.56 0.24 -0.50 0.23 0.56 1.00 -0.81 Freq:7-22 0.72 -0.50 0.59 -0.42 -0.72 -0.81 1.00 Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 19 / 22
  • 26. Gráfico de correlação -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 Freq:7-14 Defasagem escolar Anos.estudo:25+ Analfabetos:25+ Evasão:7-14 Evasao:15-17 Freq:7-22 Freq:7-14 Defasagem escolar Anos.estudo:25+ Analfabetos:25+ Evasão:7-14 Evasao:15-17 Freq:7-22 Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 20 / 22
  • 27. Perguntas 1 Deseja-se criar uma ordenação pela primeira componente principal da matriz de variâncias e covariâncias. 2 Quanto da variabilidade total dos dados é explicado pela primeira componente principai? Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 21 / 22
  • 28. Motivação 2 Estudos mostram que grande parte de adultos e adolescentes norte-americanos usam regularmente substâncias psicoativas. Em um destes estudos (Huba et al. 1981, J. of Personality and Social Psychology), dados foram coletados de 1634 estudantes na área metropolitana de Los Angeles. Cada participante completou um questionário informando o número de vezes que cada item foi usado. Os itens são os seguintes: cigarro, cerveja, vinho, licor, cocaína, tranquilizantes, medicamentos, heroína, maconha, haxixe, inalantes, alucinógenos e anfetaminas. Ver arquivo Motivação_R.ipynb . Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 22 / 22
  • 29. Motivação 2 Estudos mostram que grande parte de adultos e adolescentes norte-americanos usam regularmente substâncias psicoativas. Em um destes estudos (Huba et al. 1981, J. of Personality and Social Psychology), dados foram coletados de 1634 estudantes na área metropolitana de Los Angeles. Cada participante completou um questionário informando o número de vezes que cada item foi usado. Os itens são os seguintes: cigarro, cerveja, vinho, licor, cocaína, tranquilizantes, medicamentos, heroína, maconha, haxixe, inalantes, alucinógenos e anfetaminas. Ver arquivo Motivação_R.ipynb . Prof. Cibele Russo SME0822 Análise Multivariada e ANS 2. semestre 2020 22 / 22