Aula 26_01_2015(exemplos_multivariados)Capítulo1

195 visualizações

Publicada em

Arquivo referente a primeira da disciplina métodos estatísticos multivariados. Nele contém uma breve descrição de exemplos multivariados segundo o livro do Bryan j. F. Manly.

Publicada em: Educação
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
195
No SlideShare
0
A partir de incorporações
0
Número de incorporações
7
Ações
Compartilhamentos
0
Downloads
4
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Aula 26_01_2015(exemplos_multivariados)Capítulo1

  1. 1. Disciplina: M´etodos estat´ısticos multivariados Ministrante: Carlos Tadeu dos Santos Dias
  2. 2. Disciplina: M´etodos estat´ısticos multivariados Ministrante: Carlos Tadeu dos Santos Dias Adriele Giaretta Biase Maria Joseane Cruz da Silva Tatiana Assis In´ıcio do curso: 26/01/2015 Fim do curso: 13/02/2015 Livro de referˆencia: Bryan J. F. Manly (M´etodos estat´ısticos multivariados, uma introduc¸ ˜ao, 3a edic¸ ˜ao) URL1: http://www.lce.esalq.usp.br/tadeu.html URL2: https://sites.google.com/site/carlostadeudossantosdias/
  3. 3. M´etodos estat´ısticos multivariados Objetivo Introduzir os m´etodos multivariados de forma simples por meio de exemplos pr´aticos; Seguir como um guia pr´atico; Capacitar o aluno na an´alise de experimentos agronˆomicos bem como na interpretac¸ ˜ao de dados obtidos.
  4. 4. M´etodos estat´ısticos multivariados Objetivo Introduzir os m´etodos multivariados de forma simples por meio de exemplos pr´aticos; Seguir como um guia pr´atico; Capacitar o aluno na an´alise de experimentos agronˆomicos bem como na interpretac¸ ˜ao de dados obtidos. Pr´e-requisitos Conhecimento pr´atico de estat´ıstica elementar; Testes de significˆancia usando a distribuic¸ ˜ao normal, t, qui-quadrado e F. An´alise de variˆancia e regress˜ao linear; ´Algebra matricial; Acesso a algum pacote computacional (SAS, R, Excel, ...).
  5. 5. M´etodos estat´ısticos multivariados −→ Exemplos 1 - Pardais sobreviventes de uma tempestade Ap´os uma tempestade pardais foram levados a um determinado laborat´orio biol´ogico (Hermon Bumpus na Universidade de Brown em Rhode Island); Metade dos p´assaros morreram; Foram feitas 8 medidas morfol´ogicas em cada p´assaro e tamb´em verificou seu peso; Foram dispon´ıveis, no livro, apenas 5 das vari´aveis medidas (X1 - Comprimento total, X2 - extens˜ao alar, X3 - Comprimento do bico e cabec¸a, X4 - comprimento do ´umero, X5 - comprimento da quilha do esterno); Temos dois grupos: grupo 1 caracterizado pelos p´assaros vivos (de 1 `a 21) e grupo 2 caracterizado pelos p´assaros mortos (de 22 `a 49).
  6. 6. M´etodos estat´ısticos multivariados −→ Exemplos 1 - Pardais sobreviventes de uma tempestade Ap´os uma tempestade pardais foram levados a um determinado laborat´orio biol´ogico (Hermon Bumpus na Universidade de Brown em Rhode Island); Metade dos p´assaros morreram; Foram feitas 8 medidas morfol´ogicas em cada p´assaro e tamb´em verificou seu peso; Foram dispon´ıveis, no livro, apenas 5 das vari´aveis medidas (X1 - Comprimento total, X2 - extens˜ao alar, X3 - Comprimento do bico e cabec¸a, X4 - comprimento do ´umero, X5 - comprimento da quilha do esterno); Temos dois grupos: grupo 1 caracterizado pelos p´assaros vivos (de 1 `a 21) e grupo 2 caracterizado pelos p´assaros mortos (de 22 `a 49). Tabela 1: Medidas do corpo de pardocas
  7. 7. M´etodos estat´ısticos multivariados −→ Exemplos 1 - Pardais sobreviventes de uma tempestade Quest˜oes 1- Ser´a que um valor grande para uma determinada vari´avel ser´a grande para as demais vari´aveis? 2- Os p´assaros sobreviventes e n˜ao-sobreviventes tˆem diferenc¸as estatisticamente significantes para os valores m´edios das vari´aveis consideradas? Que m´etodo estat´ıstico usar? 3- Existe variac¸ ˜ao similar entre os grupos nas diferentes vari´aveis medidas? Que m´etodo estat´ıstico usar para verificar este problema? 4- Se os grupos diferem em termos das distribuic¸ ˜oes das vari´aveis ´e poss´ıvel construir alguma func¸ ˜ao dessas vari´aveis que separe os dois grupos?
  8. 8. M´etodos estat´ısticos multivariados −→ Exemplos 1 - Pardais sobreviventes de uma tempestade Quest˜oes 1- Ser´a que um valor grande para uma determinada vari´avel ser´a grande para as demais vari´aveis? 2- Os p´assaros sobreviventes e n˜ao-sobreviventes tˆem diferenc¸as estatisticamente significantes para os valores m´edios das vari´aveis consideradas? Que m´etodo estat´ıstico usar? 3- Existe variac¸ ˜ao similar entre os grupos nas diferentes vari´aveis medidas? Que m´etodo estat´ıstico usar para verificar este problema? 4- Se os grupos diferem em termos das distribuic¸ ˜oes das vari´aveis ´e poss´ıvel construir alguma func¸ ˜ao dessas vari´aveis que separe os dois grupos? Quest˜ao 2: Caso univariado −→ Teste t; Caso multivariado −→ T2-Hotteling.
  9. 9. M´etodos estat´ısticos multivariados −→ Exemplos 1 - Pardais sobreviventes de uma tempestade Quest˜oes 1- Ser´a que um valor grande para uma determinada vari´avel ser´a grande para as demais vari´aveis? 2- Os p´assaros sobreviventes e n˜ao-sobreviventes tˆem diferenc¸as estatisticamente significantes para os valores m´edios das vari´aveis consideradas? Que m´etodo estat´ıstico usar? 3- Existe variac¸ ˜ao similar entre os grupos nas diferentes vari´aveis medidas? Que m´etodo estat´ıstico usar para verificar este problema? 4- Se os grupos diferem em termos das distribuic¸ ˜oes das vari´aveis ´e poss´ıvel construir alguma func¸ ˜ao dessas vari´aveis que separe os dois grupos? Quest˜ao 2: Caso univariado −→ Teste t; Caso multivariado −→ T2-Hotteling. Quest˜ao 3: Caso univariado −→ Teste F, Teste de Levene (1960); Caso multivariado −→ Teste de M-Box, Teste de Van Valen (1978).
  10. 10. M´etodos estat´ısticos multivariados −→ Exemplos 1 - Pardais sobreviventes de uma tempestade Outros m´etodos: An´alise discriminante −→ verificar o qu˜ao bem os pardais sobreviventes e n˜ao-sobreviventes podem ser separados usando suas medidas;
  11. 11. M´etodos estat´ısticos multivariados −→ Exemplos 2 - Crˆanios eg´ıpcios Medidas de crˆanios masculinos da ´area de Tebas no Egito foram obtidas (X1 - largura m´axima, X2 - altura basibregram´atica, X3 - comprimento basilveolar, X4 - altura nasal); 5 amostras de 30 crˆancios foram escolhidas (per´ıodo pr´e-din´astico primitivo (cerca de 4000 a.C), pr´e-din´astico antigo (cerca de 3300 a.C), 12o e 13o dinastias (cerca de 1850 a.C), per´ıodo Romano (cerca de 150 d.C)). Tabela 2: Medidas de crˆanios eg´ıpcios masculinos (mm)
  12. 12. M´etodos estat´ısticos multivariados −→ Exemplos 2 - Crˆanios eg´ıpcios Quest˜oes Como est˜ao relacionadas as quatro medidas? Existe diferenc¸a estatisticamente significantes nas m´edias amostrais ao longo do tempo na forma e tamanho dos crˆanios? Que estat´ıstica usar? Existe diferenc¸a significantes nos desvios padr˜ao amostrais para as vari´aveis, e se existem, essas diferenc¸as refletem mudanc¸as graduais ao longo do tempo na quantidade de variac¸ ˜ao? Que estat´ıstica usar? ´E poss´ıvel construir uma func¸ ˜ao das quatro vari´aveis que, em algum sentido, que descreva as mudanc¸as ao longo do tempo?
  13. 13. M´etodos estat´ısticos multivariados −→ Exemplos 2 - Crˆanios eg´ıpcios Quest˜oes Como est˜ao relacionadas as quatro medidas? Existe diferenc¸a estatisticamente significantes nas m´edias amostrais ao longo do tempo na forma e tamanho dos crˆanios? Que estat´ıstica usar? Existe diferenc¸a significantes nos desvios padr˜ao amostrais para as vari´aveis, e se existem, essas diferenc¸as refletem mudanc¸as graduais ao longo do tempo na quantidade de variac¸ ˜ao? Que estat´ıstica usar? ´E poss´ıvel construir uma func¸ ˜ao das quatro vari´aveis que, em algum sentido, que descreva as mudanc¸as ao longo do tempo? Quest˜ao 2: Caso univariado −→ Teste F (ANOVA); Caso multivariado −→ Teste de lambda Wilks, Estat´ıstica de Pillai, Trac¸o de Lawley-Hotelling (ANOVA multivariada).
  14. 14. M´etodos estat´ısticos multivariados −→ Exemplos 2 - Crˆanios eg´ıpcios Quest˜oes Como est˜ao relacionadas as quatro medidas? Existe diferenc¸a estatisticamente significantes nas m´edias amostrais ao longo do tempo na forma e tamanho dos crˆanios? Que estat´ıstica usar? Existe diferenc¸a significantes nos desvios padr˜ao amostrais para as vari´aveis, e se existem, essas diferenc¸as refletem mudanc¸as graduais ao longo do tempo na quantidade de variac¸ ˜ao? Que estat´ıstica usar? ´E poss´ıvel construir uma func¸ ˜ao das quatro vari´aveis que, em algum sentido, que descreva as mudanc¸as ao longo do tempo? Quest˜ao 2: Caso univariado −→ Teste F (ANOVA); Caso multivariado −→ Teste de lambda Wilks, Estat´ıstica de Pillai, Trac¸o de Lawley-Hotelling (ANOVA multivariada). Quest˜ao 3: Caso univariado −→ Teste de M-Box; Caso multivariado −→ Teste de M-Box.
  15. 15. M´etodos estat´ısticos multivariados −→ Exemplos 2 - Crˆanios eg´ıpcios Outros m´etodos: An´alise discriminante −→ verificar como os crˆanios de diferentes ´epocas podem ser separados usando medidas de tamanho. 3 - Distribuic¸ ˜ao de uma borboleta (Colˆonias de borboletas) Os dados cont´em 16 colˆonias de borboletas; Quatro ambientais (altitude, precipitac¸ ˜ao anual, temperatura m´axima, temperatura m´ınima); Seis vari´aveis gen´eticas (frequˆencias percentuais para diferentes genes (f´osforo glucoxisomerase)).
  16. 16. M´etodos estat´ısticos multivariados −→ Exemplos 2 - Crˆanios eg´ıpcios Outros m´etodos: An´alise discriminante −→ verificar como os crˆanios de diferentes ´epocas podem ser separados usando medidas de tamanho. 3 - Distribuic¸ ˜ao de uma borboleta (Colˆonias de borboletas) Os dados cont´em 16 colˆonias de borboletas; Quatro ambientais (altitude, precipitac¸ ˜ao anual, temperatura m´axima, temperatura m´ınima); Seis vari´aveis gen´eticas (frequˆencias percentuais para diferentes genes (f´osforo glucoxisomerase)). Tabela 3: Vari´aveis ambientais e frequˆencias gˆenicas
  17. 17. M´etodos estat´ısticos multivariados −→ Exemplos 3 - Distribuic¸ ˜ao de uma borboleta (Colˆonias de borboletas) Quest˜oes 1 - As frequˆencias Pgi s˜ao similiares para as colˆonias que est˜ao pr´oximas no espac¸o? 2 - O quanto as frequˆencias Pgi est˜ao relacionadas as vari´aveis ambientais?
  18. 18. M´etodos estat´ısticos multivariados −→ Exemplos 3 - Distribuic¸ ˜ao de uma borboleta (Colˆonias de borboletas) Quest˜oes 1 - As frequˆencias Pgi s˜ao similiares para as colˆonias que est˜ao pr´oximas no espac¸o? 2 - O quanto as frequˆencias Pgi est˜ao relacionadas as vari´aveis ambientais? Quest˜ao 1: Pode usar o escalonamento multidimensional para verificar o qu˜ao distante est˜ao os pares de colˆonias conforme as vari´aveis em quest˜ao.
  19. 19. M´etodos estat´ısticos multivariados −→ Exemplos 3 - Distribuic¸ ˜ao de uma borboleta (Colˆonias de borboletas) Quest˜oes 1 - As frequˆencias Pgi s˜ao similiares para as colˆonias que est˜ao pr´oximas no espac¸o? 2 - O quanto as frequˆencias Pgi est˜ao relacionadas as vari´aveis ambientais? Quest˜ao 1: Pode usar o escalonamento multidimensional para verificar o qu˜ao distante est˜ao os pares de colˆonias conforme as vari´aveis em quest˜ao. Quest˜ao 2: Caso de duas vari´aveis −→ Correlac¸ ˜ao de Person; Caso multivariado −→ Correlac¸ ˜ao canˆonica.
  20. 20. M´etodos estat´ısticos multivariados −→ Exemplos 3 - Distribuic¸ ˜ao de uma borboleta (Colˆonias de borboletas) Quest˜oes 1 - As frequˆencias Pgi s˜ao similiares para as colˆonias que est˜ao pr´oximas no espac¸o? 2 - O quanto as frequˆencias Pgi est˜ao relacionadas as vari´aveis ambientais? Quest˜ao 1: Pode usar o escalonamento multidimensional para verificar o qu˜ao distante est˜ao os pares de colˆonias conforme as vari´aveis em quest˜ao. Quest˜ao 2: Caso de duas vari´aveis −→ Correlac¸ ˜ao de Person; Caso multivariado −→ Correlac¸ ˜ao canˆonica. Outro m´etodo: An´alise de agrupamento −→ identificar grupos de colˆonias que s˜ao similares conforme as vari´aveis ambientais ou frequˆencias Pgi;
  21. 21. M´etodos estat´ısticos multivariados −→ Exemplos 4 - C˜aes pr´e-hist´oricos da Tailˆandia Neste exemplo temos informac¸ ˜oes de ossos encontrados em locais pr´e-hist´oricos no nordeste da Tailˆandia; N˜ao se sabe a origem dos c˜aes pr´e-hist´oricos; Foram feitas medidas da mand´ıbula dos esp´ecimes dispon´ıveis de sete grupos (c˜ao moderno, chacal dourado, lobo chinˆes, lobo indiano, cuan, Dingo, C˜ao pr´e-hist´orico); Os dados referem-se aos valores m´edios para as seis medidas de mand´ıbulas (X1 = largura da mand´ıbula, X2 = altura da mand´ıbula abaixo do primeiro molar, X3 = comprimento do primeiro molar, X4 = largura do primeiro molar, X5 = comprimento do primeiro ao terceiro molar, X1 = comprimento do primeiro ao quarto molar). Tabela 4: Medidas de mand´ıbulas para sete grupos caninos
  22. 22. M´etodos estat´ısticos multivariados −→ Exemplos 4 - C˜aes pr´e-hist´oricos da Tailˆandia Quest˜oes O que as medidas sugerem sobre o relacionamento entre os grupos? Como os c˜aes pr´e-hit´oricos parecem se relacionar com os outros grupos?
  23. 23. M´etodos estat´ısticos multivariados −→ Exemplos 4 - C˜aes pr´e-hist´oricos da Tailˆandia Quest˜oes O que as medidas sugerem sobre o relacionamento entre os grupos? Como os c˜aes pr´e-hit´oricos parecem se relacionar com os outros grupos? M´etodos estat´ısticos An´alise de agrupamento −→ verificar a similaridade entre os c˜aes pr´e-hist´oricos tailandeses e demais animais; Escalonamento multidimensional −→ verificar como os grupos de c˜aes est˜ao relacionados por meio de um mapa.
  24. 24. M´etodos estat´ısticos multivariados −→ Exemplos 5 - Emprego em pa´ıses europeus Dados de diferentes porcentagens de forc¸a de trabalho em 9 diferentes tipos de ind´ustrias para 30 pa´ıses europeus; M´etodos multivariados podem ser ´uteis para isolar grupos de pa´ıses com padr˜oes similares de emprego; O m´etodos multivariados tamb´em podem ajudar a entender o relacionamento entre os pa´ıses. Tabela 5: Porcentagem de forc¸a de trabalho de empregados em diferentes grupos de ind´ustrias M´etodos estat´ısticos
  25. 25. M´etodos estat´ısticos multivariados −→ Exemplos 5 - Emprego em pa´ıses europeus Dados de diferentes porcentagens de forc¸a de trabalho em 9 diferentes tipos de ind´ustrias para 30 pa´ıses europeus; M´etodos multivariados podem ser ´uteis para isolar grupos de pa´ıses com padr˜oes similares de emprego; O m´etodos multivariados tamb´em podem ajudar a entender o relacionamento entre os pa´ıses. Tabela 5: Porcentagem de forc¸a de trabalho de empregados em diferentes grupos de ind´ustrias M´etodos estat´ısticos An´alise de componentes principais −→ verificar a existˆencia de grupos de pa´ıses padr˜oes similares de emprego; An´alise de Fatores −→ verificar a importˆancia das vari´aveis em cada pa´ıs Europeu; An´alise de agrupamento −→ verificar os grupos de pa´ıses que s˜ao similares de acordo com padr˜ao de emprego.
  26. 26. M´etodos estat´ısticos multivariados An´alise de componentes principais; An´alise de Fatores; An´alise de func¸ ˜ao discriminante; An´alise de Agrupamento; Correlac¸ ˜ao Canˆonica; Escalonamento multidimensional; An´alise de correspondˆencia.
  27. 27. M´etodos estat´ısticos multivariados −→ Distribuic¸ ˜ao normal multivariada Univariado Tem uma curva de frequˆencias na forma de sino; Muitos m´etodos univariados padr˜ao tem por base a suposic¸ ˜ao de que os dados s˜ao normalmente distribu´ıdos (ANOVA); Multivariado
  28. 28. M´etodos estat´ısticos multivariados −→ Distribuic¸ ˜ao normal multivariada Univariado Tem uma curva de frequˆencias na forma de sino; Muitos m´etodos univariados padr˜ao tem por base a suposic¸ ˜ao de que os dados s˜ao normalmente distribu´ıdos (ANOVA); Multivariado V´arias vari´aveis; Os dados tenham distribuic¸ ˜ao normal multivariada; Se todas as vari´aveis parecerem ser normalmente distribu´ıdas ent˜ao assume-se que a distribuic¸ ˜ao conjunta ´e normal multivariada; Se uma das vari´aveis apresentarem distribuic¸ ˜ao assim´etrica com v´arios valores baixos ou muito altos, pode haver muitos valores repetidos. Este tipo de problema pode ser superado por uma transformac¸ ˜ao de dados apropriada; A distribuic¸ ˜ao normal multivariada ´e caracterizada por um vetor de m´edias e uma matriz de covariˆancias.

×