Análises multivariadas em comunidades vegetais

73 visualizações

Publicada em

Descrição de comunidades vegetais, análises multivariadas e alguns exemplos de métodos usados em estudos de comunidades vegetais (AMOVA, Análise Discriminante Linear e Análise de Componentes Principais)

Publicada em: Ciências
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
73
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
4
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Análises multivariadas em comunidades vegetais

  1. 1. Aplicação de análises multivariadas em estudos de comunidades vegetais Maria W. Pil Concurso Docente, UFPR – Palotina 03/12/2015 mariapil@gmail.com d = 10 Canonical weights d = 10 ArgLeu Ser Thr Pro Ala Gly Val Lys Asn Gln His Glu Asp Tyr Cys Phe Ile Met Trp Canonical weights x1 ArgLeu Ser Thr Pro Ala Gly Val LysAsn Gln His Glu Asp Tyr Cys Phe Ile Met Trp Cos(variates,canonical variates) Eigenvalues d = 2 Scores and classes ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● cytomemb peri RS1 RS2 RS3 RS4 RS5 RS6 RS7 RS8 RS9RS10 RS11 RS12 RS13 RS14 RS15 RS16 RS17 RS18 RS19 Cos(components,canonical variates) d = 0.5 Class scores cyto memb peri
  2. 2. 2 Outline • Comunidades vegetais • Tipos de dados • Tipos de estudos • O que são Análises Multivariadas? • Vantagens e características • Escolha de métodos • Exemplos de métodos • MANOVA • Análise Discriminante Linear • Análise de Componentes Principais
  3. 3. Comunidades vegetais
  4. 4. 4 Comunidade de mangue
  5. 5. • Unidades de amostragem: • E.g.: plots, transectos,quadrats • Geralmente em estrutura espacial ou temporal hierárquica • Parâmetros registrados por taxas múltiplas em cada unidade • E.g.: contagem simples, densidades,% de cobertura vegetal, presença-ausência • Variáveis ambientais registradas em cada unidade • pH, salinidade,temperatura, nutrientes,tipo de sedimento do solo, elevação Dados de estudos de comunidades vegetais
  6. 6. • Examinar padrões temporais e espaciais na composição de espécies • Relacionar padrões à variáveis ambientais das unidades amostradas • Determinar quais táxons são chave em “direcionar” os padrões temporais e espaciais Exemplos de objetivos em estudos de comunidade vegetal
  7. 7. 7 Complexidade de variáveis • Composição da comunidade • Características morfológicas das espécies • Características ambientais
  8. 8. O que são Análises Multivariadas? • Dois grupos de métodos estatísticos: univariada e multivariada • A análise multivariada (AMV) fornece métodos estatísticos para estudo das relações conjuntas de variáveis em dados que contêm intercorrelações. • Porque muitas variáveis podem ser consideradas simultaneamente, as interpretações podem ser feitas que não são possíveis com estatísticas univariadas. 8
  9. 9. AMV usa todos os dados disponíveis para capturar o máximo de informação possível. O princípio básico é diminuir o número de variáveis de centenas para um mero punhado. 9 O que são Análises Multivariadas? AMV [
  10. 10. Pluralitas non est ponenda sine necessitate. Tradução aproximada: "Não torne as coisas mais complicadas do que precisam ser." Análises multivariadas são baseadas na “Navalha de Ockham” William of Ockham (1285-1347) 10 William de Ockham foi um monge Inglês do século 14, autor do princípio lógico de que a explicação para qualquer fenômeno deve assumir apenas as premissas estritamente necessárias à explicação do mesmo e eliminar todas as que não causariam qualquer diferença aparente nas predições da hipótese ou teoria. O termo "navalha" se explica porque o princípio serve para cortar as partes desnecessárias de uma teoria científica.
  11. 11. 11 • O principal elemento da AMV é a redução da dimensionalidade. Levado ao extremo, isso pode significar ir de centenas de dimensões (variáveis) para apenas algumas, o que nos permite criar um gráfico bidimensional. • Usando estes gráficos, que os nossos olhos e cérebros podem facilmente manipular, somos capazes de perscrutar o banco de dados e identificar tendências e correlações. Redução de dimensionalidade
  12. 12. Tmt X1 X4 X5 Rep Y avec Y sans 1 -1 -1 -1 1 2.51 2.74 1 -1 -1 -1 2 2.36 3.22 1 -1 -1 -1 3 2.45 2.56 2 -1 0 1 1 2.63 3.23 2 -1 0 1 2 2.55 2.47 2 -1 0 1 3 2.65 2.31 3 -1 1 0 1 2.45 2.67 3 -1 1 0 2 2.6 2.45 3 -1 1 0 3 2.53 2.98 4 0 -1 1 1 3.02 3.22 4 0 -1 1 2 2.7 2.57 4 0 -1 1 3 2.97 2.63 5 0 0 0 1 2.89 3.16 5 0 0 0 2 2.56 3.32 5 0 0 0 3 2.52 3.26 6 0 1 -1 1 2.44 3.1 6 0 1 -1 2 2.22 2.97 6 0 1 -1 3 2.27 2.92 Dados brutos: impossíveis de interpretar Gráficos interpretáveis tendência tendência tendência Y X X X X N linhas N colunas Redução de dimensionalidade
  13. 13. 13 • Auxilia na compreensão de comportamentos complexos no ambiente • Acrescenta informações potencialmente úteis • Permite preservar as correlações naturais entre as múltiplas influências de comportamento sem isolar qualquer indivíduo ou variável Vantagens
  14. 14. 14 • Todas as variáveis devem ser inter-relacionadas • Diferentes efeitos das variáveis não podem ser interpretados de forma separada • Tem o propósito de medir, explicar e prever o grau de relacionamento entre combinações ponderadas de variáveis • Consiste em combinações múltiplas de variáveis Características
  15. 15. 15 Como escolher o método • Depende do objetivo do investigador • Para cartografar ou descrever a vegetação: classificação • Para avaliar relações entre a vegetação e o ambiente: ordenação • Classificação: identifica indivíduos ou objetos em grupos ou classes se baseando em medidas das variáveis através de algum índice de similaridade E.g.: Análise discriminante • Ordenação: sumariza um grande número de medidas em poucas variáveis sintéticas (eixos ou componentes) E.g.: PCA
  16. 16. Exemplos de Métodos • Que determinam diferenças entre grupos: • ANOVA Fatorial; • MANOVA; • Análise Discriminante; • Que determinam a estrutura da relação: • Regressão Múltipla • Correlação Canônica • Análise de Componentes Principais; • Análise de Correspondência; • Análise de agrupamento;
  17. 17. 17 • Uma extensão de ANOVA em que os efeitos principais e interações são avaliados em uma combinação de VDs • Análise de variância realizada em múltiplas variáveis dependentes (VD) simultaneamente • Compara várias médias de diferentes populações para verificar se essas populações possuem médias de variáveis iguais ou não • Testa se diferenças médias entre os grupos em uma combinação de VDs é provável de ocorrer por acaso MANOVA Teste Número de VI Número de VD Teste t 1 1 ANOVA Múltiplos 1 MANOVA Múltiplos Múltiplos
  18. 18. 18 • H0: μ11 = μ12 =…= μ1k ; = μ21 = μ22 =…= μ2k • Onde μij significa a média populacional da variável i no grupo j. Essa Ho diz que a média da variável 1 é a mesma para todos os k grupos e que as médias da vaiável 2 são as mesmas para k grupos, e assim por diante. • HA: As k populações não tem as mesmas médias paras as diversas variáveis. Teste de hipótese da MANOVA
  19. 19. 19 • A MANOVA desenvolve uma combinação linear de variáveis dependentes • Equação: Z = c1V1 + c2V2 + c3V3 + ...+ cnVn • Essa combinação leva em consideração todas as possíveis correlações entre as variáveis Correlações da MANOVA V1 V2 V3 V1 SSv1 SCPv1xv2 SCPv1xv3 V2 SCPv1xv2 SSv2 SCPv2xv3 V3 SCPv1xv3 SCPv2xv3 SSv3 SS = Soma dos Quadrados SCP = Soma dos Produtos Cruzados
  20. 20. 20 • Wilks’ lambda (Λ) • Teste estatístico comumente usado em MANOVA • H0 é rejeitada quando o valor de Λ é pequeno (0-1) • Λ são normalmente transformados em valores de F or X2 mais familiares • Teste de Pillai-Bertlett • Nesse caso, valores altos significam rejeição de Ho • Também é transformado em estatística de F Índices da MANOVA
  21. 21. 21 Reich et al. 1999. Generality of leaf trait relationships: a test across six biomes. Ecology 80: 1955–1969. • Reich et al. (1999) examinou a generalidade das características foliares de espécies diferentes em uma variedade de ecossistemas e regiões geográficas. • 2 populações, entre 3 e 11 espécies, 2 grupos funcionais (arbustos e árvores) e 5 variáveis: • área foliar específica, concentração de N2 na folha,capacidade fotossintética líquida à base de massa, capacidade fotossintética líquida à base de área foliar e capacidade de condutância difusora fotossintética. • Vamos testar os efeitos da localização e grupo funcional, e sua interação, nessas cinco variáveis de resposta tomadas em conjunto Exemplo de MANOVA
  22. 22. 22 Exemplo de MANOVA Aceitamos H0, portanto não há diferenças nas médias das variáveis entre as populações.
  23. 23. • Suponha duas classes • Assuma que elas são linearmente separáveis por uma fronteira l(θ) • Otimizar o parâmetro θ para encontrar a melhor fronteira. • Análise Discriminante gera uma combinação linear das variáveis que maximiza a probabilidade de observações serem atribuídas corretamente aos seus grupos pré-determinados Ruim Boa Análise Discriminante Linear
  24. 24. • Tenta encontrar uma transformação linear através da maximização da distância entre-classes e minimização da distância intra-classe. • O método tenta encontrar a melhor direção de maneira que quando os dados são projetados em um plano, as classes possam ser separadas. Análise Discriminante Linear
  25. 25. 25 Análise de Componentes Principais • descreve os dados contidos num quadro indivíduos- variáveis numéricas: p variáveis serão mediadas com n indivíduos • transforma um conjunto original de variáveis em outro conjunto: os componentes principais de dimensões equivalentes • detecta a estrutura nas relações entre as variáveis
  26. 26. 26 1. Padronizar os dados 2. Calcular a matriz de covariância 3. Encontrar os eigenvalues e eigenvectors da matriz de covariância Eigenvalues:Conceitualmente podem ser considerados como medidor da força (comprimento relativo) de um eixo no espaço N- dimensional Eigenvectors:Enquanto um eigenvalue é o comprimento de um eixo, o eigenvector determina a sua orientação no espaço 4. Plotar os componentes principais sobre os dados Passos para a Análise de Componentes Principais
  27. 27. 27 Exemplo de mangue • Composição da comunidade • Características morfológicas das espécies • Características ambientais
  28. 28. 28 ANTONINA BABITONGA GUARATUBA fringe bacia transição Características do solo: conteúdo de areia e argila, salinidade(PWsalinity), composição orgânica (O.M.), pH e capacidade de troca de cátions (CEC).
  29. 29. 29 • Áreas não ficaram bem separadas • Maior parte dos dados sumarizados por atributos do solo. • PCA1 explica 36% da variância e representado principalmente por conteúdo de areia • PCA2 explica 24% da variância, representado principalmente por salinidade
  30. 30. 30
  31. 31. 31 Mito ou verdade? • Uma análise estatística com mais de 2 variáveis é uma análise multivariada. Mito. Quando mais de 2 variáveis estão inter-relacionados uns com os outros,podemos usar estatística multivariada. • A finalidade da estatística multivariada é estabelecer correlação entre os conjuntos de variáveis. Verdade. Mas é objetivo não se limita a determinar relação entre conjunto de variáveis.Ele tende a controlar o efeito de algumas variáveis que intervêm em relacionamento entre os conjuntos de variáveis.
  32. 32. 32 Resumo • Uma comunidade vegetal pode ser definida como todas as espécies que ocupam uma determinada área circunscrita por um ecólogo para o propósito de um estudo • AMV fornecem métodos estatísticos para estudo das relações conjuntas de variáveis em dados que contêm intercorrelações. • O princípio básico da AMV é diminuir o número de variáveis correlacionadas (redução da dimensionalidade). • Classificação: identifica indivíduos ou objetos em grupos ou classes se baseando em medidas das variáveis através de algum índice de similaridade E.g.: Análise discriminante. • Ordenação: sumariza um grande número de medidas em poucas variáveis sintéticas (eixos ou componentes) E.g.: PCA. • MANOVA é uma extensão de ANOVA em que os efeitos principais e interações são avaliados em uma combinação de VDs. • Análise Discriminante gera uma combinação linear das variáveis que maximiza a probabilidade de observações serem atribuídas corretamente aos seus grupos pré-determinados. • Análise de Componentes Principais transforma um conjunto original de variáveis em outro conjunto: os componentes principais de dimensões equivalentes.
  33. 33. 33 •Objetivo: • explorar e identificar dimensões não reconhecidas que afetam o comportamento • obter avaliações comparativas de objetos quando as bases específicas de comparação são desconhecidas ou identificadas •Passos: •- identificar todos os objetos relevantes •- escolher entre dados de similaridade ou de preferência •- selecionar uma análise agregada ou desagregada Escalonamento Multidimensional
  34. 34. 34
  35. 35. 35

×