SlideShare uma empresa Scribd logo
ANÁLISES DE
AGRUPAMENTO E
DISSIMILARIDADE

                    Mestrando: Cristiano Lemes
                             Prof: Giovani Benin




  Teoria da Seleção - 2012
ANÁLISES QUE SERÃO
ABORDADAS

   Métodos de Agrupamento:
     Variáveis Canônicas
     Componentes Principais
     Transformar matriz de similaridade em dissimilaridade


   Dissimilaridade:
      Distância Euclidiana (baseada no arquivo de médias)
      Distância Mahalabonis (considera as repetições)
      Correlação cofenética e Ponto de corte

   Bootstrap e ponto de corte em dendogramas


   Dissimilaridade através de marcadores:
      morfológicos
      Moleculares
TÉCNICAS DE AGRUPAMENTO

   Os métodos de agrupamento têm por finalidade separar um
    grupo original de observações em vários subgrupos, de forma a
    obter homogeneidade dentro e heterogeneidade entre os
    subgrupos.

   Dentre estes métodos, os hierárquicos e os de otimização são
    empregados em grande escala pelos melhoristas de plantas.
Principais análises

1 - Estimativa de uma medida de distância


        Distancia Euclidiana
        Distancia generalizada de Mahalanobis


 2 - Adoção de uma técnica de agrupamento

        Variáveis canônicas                       Dispersão gráfica
        Componentes principais
        Agrupamento de Tocher
        Agrupamento (Vizinho mais próximo, mais distante e distância
        média)
FINALIDADE:

    Reunir os genitores em grupos


             Segundo critérios de similaridade ou dissimilaridade

                   OBJETIV
                                        Homogeneidade dentro de grupos
                   OS:
                                        Heterogeneidade entre grupos

Etapas:
              1 – Estimativa das distâncias
              2 – Adoção de uma técnica de agrupamento

  Identificação do par de genitores mais similares
  Avalia a possibilidade de inclusão de novos genitores
VARIÁVEIS CANÔNICAS
-   Técnica de Dispersão Gráfica
-   exige experimento com delineamento experimental (repetições)
-    Para serem representativos as 2 primeiras variáveis devem
    explicar pelo menos 80% da variação original dos dados;
-   Abrir arquivo de médias
-   Em “Dispersão” completar com o “cre”
-   Declarar o número de variáveis
-   Nomear variáveis
Nesse caso as 2
    primeiras
    variáveis
    explicam
mais de 80% da
variação original
   dos dados
COMPONENTES PRINCIPAIS
-   Técnica de Dispersão Gráfica
-   Permitem a identificação da divergência genética
-   Não exige experimentos com delineamento experimental (usa-se apenas
    o arquivo de médias)
-   Para ser representativo os 2 primeiros componentes devem explicar
    pelo menos 80% da variação original dos dados.
Nesse caso os 2
    primeiros
 componentes
    explicam
mais de 80% da
variação original
   dos dados
C. PRINCIPAIS VS V. CANÔNICAS

   SEMELHANÇAS:
       Permitem a identificação da divergência genética;

        Possibilidade de resumir o conjunto de variáveis
        originais em poucos componentes, o que significará ter
        uma boa aproximação do comportamento dos indivíduos
        de um espaço dimensional em um espaço bi ou tri
        dimensional;

     Para   serem representativos os 2 primeiros componentes
        devem explicar pelo menos 80% da variação original dos
        dados;

       Os componentes são independentes entre si;

       Ambas utilizam dados padronizados.
TOCHER
-   Método de Agrupamento
-   A média das medidas de distância dentro de cada grupo deve ser
    menor do que as distâncias médias entre quaisquer grupo
-   Não permite comparar acessos dentro do mesmo do mesmo grupo
DISSIMILARIDADE - DISTÂNCIA DE
 EUCLIDIANA
Observações individuais


   Experimentos que não contemplam delineamento
                                                            Deve ser
   Experimentos com delineamento - Médias das repetições
                                                            evitado
   Menor precisão em relação a distancia generalizada de Mahalanobis
-   Saída do Dendograma

-   Desvantagem do Genes:

    -   Pouca possibilidade para editar e formatar as figuras
Dissimilaridade - Distância de Mahalanobis
- Leva em conta as variâncias e covariâncias e correlações residuais
entre os caracteres aferidos.
-Considera as repetições experimentais
-é possível destacar a distância generalizada de Mahalanobis D 2
- Leva em consideração a existência de correlações entre os caracteres
analisados,
 Necessita de ensaios experimentais com repetições
-Nomear as Variáveis
- Gerar Matriz
-Processar Agrupamento

-Bootstrap
    -Testa a consistência das bifurcações em porcentagem a partir de um
    número determinado de simulações
CONTRIBUIÇÃO RELATIVA DOS CARACTERES
– SINGH 1981

  Identificação dos caracteres que mais contribuíram para
   a dissimilaridade genética entre os genótipos avaliados
Dendograma gerado a partir da matriz de distância de
 Mahalanobis
CORRELAÇÃO COFENÉTICA (CCC)
Mede a correlação (ajuste) entre a matriz de distância original e as distâncias
apresentadas no dendrograma.
Muito importante quando são realizadas inferências com base no
dendrograma
Valores de CCC acima de 0,70 indicam uma representação confiável entre a
matriz de distância original e as distâncias gráficas
Abrir a “matriz de distância genética” que se deseja analisar
CONSTRUINDO DENDOGRAMAS
    NO NTSYS




- Abrir a “matriz de
   distância genética” no
   Genes

-   Exportá-lo para o Excel

-   Formatá-lo conforme o
    modelo ao lado
- NoNTSYS, em clustering, clicar
em SAHN, e no Imput file abrir a
 matriz de dissimilaridade (Excel)
                -
No output tree file, digitar
                                               um nome de saída
                                                 (exemplo DE =
                                                 dendrograma)




Em Clustering methods deixar UPGMA; aí
pedir para rodar (Compute), Com isso vai
abrir uma janela de escritas que pode ser
  fechada, e após deves buscar no canto
  inferior esquerdo da janela uma figura
   pequena em forma de dendrograma:
Clicando nela aparece a FIGURA que pode
ser formatada conforme interesse, sendo
          salva formato metafile.
Conforme exposto acima, o programa Ntsys possui vários
mecanismos que podem ser ajustados para formatar os
    dendogramas da mais adequada a cada situação
Dendograma feito no Ntsys
MATRIZ MAHALANOBIS - NTSYS

                   Idem passos anteriores para
                construção do dendograma a partir
                 da matriz de Distância Euclidiana
CCC NO NTSYS



                Lembrar do arquivo
               de saída que foi salvo
                   anteriormente
- Antes de começar o cálculo do CCC refazer analise de dissimilaridade no Ntsys,
      substituindo o nome dos genótipos por letras.

- Calcular a matriz cofenética a partir do dentrograma que foi salvo (DE). Isto é
      feito no mesmo local clustering, clicar em Cophenetic values, e em
      Imput tree file abrir o DE e na Output Coph file, colocar um nome de
      saída (CCC).

      - Após isso clicar em “Compute”.
-Depois, clicar em Graphics, em seguida em Matrix comprison plot, e no
Input file 1 (X) abrir a matriz de dissimilaridade do Excel, aquela do inicio, e
no Input file 2 (X), abrir a matriz cofenética de nome salvo (CCC).

- No Input file 3 (X) não vai nada. No Number of permutations, digitar
1000. (feito isso pedir para rodar). Vai abrir um gráfico que quando fechado
aparece uma janela de escritas, e em uma delas aparece o valor da correlação
entre as matrizes e que é o valor cofenético.
CÁLCULO DE SIMILARIDADE GENÉTICA A
PARTIR DE MARCADORES MOLECULARES




 - Juntar todos os marcadores polimórficos em única planilha do
    Excel

 - Colocar nome dos genótipos e números de códigos (exemplo
    1=cálculo da similaridade; 10=número de genótipos;
    182=número de marcadores utilizados)
- No NTSYS: entrar em Similarity, depois em quantitative date
e no Input file one buscar a planilha de dados do Excel com os
códigos, genótipos e marcadores.
- Deixar clicado X em By rows, Coefficient clicar em DICE, e
em Output file escrever qualquer nome de saída do arquivo de
similaridade (só escrever o nome que ele salva no mesmo lugar que
foi buscada a planilha de dados anterior.
- Rodar a análise (compute) e depois editar o dendograma
Transformá-la em
                                        dissimilaridade
                                     genética (1 menos os
                                           valores de
                                       similaridade que
                                            abrirem


       Após, sem números em
formato de fórmula, inserir uma
coluna e duas linhas, colocando
o nome dos genótipos em forma
de matriz, porém, nas primeiras
  três células da linha digitar os
   códigos: 2=indica cálculo de
     dissimilaridade, 10 e 10=
 indicam a dimensão da matriz.
OBRIGADO



   cristianolemes.utfpr@gmail.com

Mais conteúdo relacionado

Mais procurados

Métodos de extensão rural
Métodos de extensão ruralMétodos de extensão rural
Métodos de extensão ruralfabio schwab
 
Análise multivarida e correlacões no Genes
Análise multivarida e correlacões no GenesAnálise multivarida e correlacões no Genes
Análise multivarida e correlacões no GenesCristiano Lemes da Silva
 
Princípios da estatística experimental
Princípios da estatística experimental   Princípios da estatística experimental
Princípios da estatística experimental UERGS
 
Como a Planta de Arroz de Desenvolve
Como a Planta de Arroz de DesenvolveComo a Planta de Arroz de Desenvolve
Como a Planta de Arroz de DesenvolveGeagra UFG
 
A cultura do Milho
A cultura do MilhoA cultura do Milho
A cultura do MilhoKiller Max
 
Apresentação de extensão rural
Apresentação de extensão ruralApresentação de extensão rural
Apresentação de extensão ruralx x
 
Caracteres qualitativos e quantitativos
Caracteres qualitativos e quantitativosCaracteres qualitativos e quantitativos
Caracteres qualitativos e quantitativosVanessa Holanda
 
Aula bioestatistica
Aula bioestatisticaAula bioestatistica
Aula bioestatisticaAleNiv
 
Identificação de plantas daninhas
Identificação de plantas daninhasIdentificação de plantas daninhas
Identificação de plantas daninhasGeagra UFG
 
Sistemas de cultivo
Sistemas de cultivoSistemas de cultivo
Sistemas de cultivoWilian Dias
 
Apostila forragicultura.
Apostila forragicultura.Apostila forragicultura.
Apostila forragicultura.Denysson Amorim
 
Bioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoBioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoFabiano Reis
 
Marcadores moleculares em plantas
Marcadores moleculares em plantasMarcadores moleculares em plantas
Marcadores moleculares em plantasUERGS
 

Mais procurados (20)

Métodos de extensão rural
Métodos de extensão ruralMétodos de extensão rural
Métodos de extensão rural
 
Aula programa Genes
Aula programa GenesAula programa Genes
Aula programa Genes
 
Forragicultura aula1
Forragicultura aula1Forragicultura aula1
Forragicultura aula1
 
Análise multivarida e correlacões no Genes
Análise multivarida e correlacões no GenesAnálise multivarida e correlacões no Genes
Análise multivarida e correlacões no Genes
 
Princípios da estatística experimental
Princípios da estatística experimental   Princípios da estatística experimental
Princípios da estatística experimental
 
Transformação de Dados
Transformação de DadosTransformação de Dados
Transformação de Dados
 
Como a Planta de Arroz de Desenvolve
Como a Planta de Arroz de DesenvolveComo a Planta de Arroz de Desenvolve
Como a Planta de Arroz de Desenvolve
 
Endogamia e heterose
Endogamia e heteroseEndogamia e heterose
Endogamia e heterose
 
A cultura do Milho
A cultura do MilhoA cultura do Milho
A cultura do Milho
 
Apresentação de extensão rural
Apresentação de extensão ruralApresentação de extensão rural
Apresentação de extensão rural
 
Caracteres qualitativos e quantitativos
Caracteres qualitativos e quantitativosCaracteres qualitativos e quantitativos
Caracteres qualitativos e quantitativos
 
Aula bioestatistica
Aula bioestatisticaAula bioestatistica
Aula bioestatistica
 
Identificação de plantas daninhas
Identificação de plantas daninhasIdentificação de plantas daninhas
Identificação de plantas daninhas
 
Plantio Direto de Amendoim
Plantio Direto de AmendoimPlantio Direto de Amendoim
Plantio Direto de Amendoim
 
Sistemas de cultivo
Sistemas de cultivoSistemas de cultivo
Sistemas de cultivo
 
Análise de Agrupamentos (Clusters)
Análise de Agrupamentos (Clusters)Análise de Agrupamentos (Clusters)
Análise de Agrupamentos (Clusters)
 
Tipos de reprodução em insetos
Tipos de reprodução em insetosTipos de reprodução em insetos
Tipos de reprodução em insetos
 
Apostila forragicultura.
Apostila forragicultura.Apostila forragicultura.
Apostila forragicultura.
 
Bioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoBioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacao
 
Marcadores moleculares em plantas
Marcadores moleculares em plantasMarcadores moleculares em plantas
Marcadores moleculares em plantas
 

Destaque

Delineamento Analises Multivariadas
Delineamento  Analises MultivariadasDelineamento  Analises Multivariadas
Delineamento Analises Multivariadasbuenobio
 
Analise de agrupamentos uem
Analise de agrupamentos uemAnalise de agrupamentos uem
Analise de agrupamentos uemfalmeida856
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e ClassificaçãoAlexandre Duarte
 
Aulamarcadoresgenticos 140828064451-phpapp02
Aulamarcadoresgenticos 140828064451-phpapp02Aulamarcadoresgenticos 140828064451-phpapp02
Aulamarcadoresgenticos 140828064451-phpapp02Leriaagro
 
Genética e Biologia Molecular
Genética e Biologia MolecularGenética e Biologia Molecular
Genética e Biologia MolecularEvelyn Golin
 
Calcogênios blog
Calcogênios blogCalcogênios blog
Calcogênios blogmazinha4
 
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...Ivaristo Americo
 
Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1UERGS
 
Eja metodologia políticas públicas de eja
Eja   metodologia políticas públicas de ejaEja   metodologia políticas públicas de eja
Eja metodologia políticas públicas de ejaPaulo Sérgio
 
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...Joselaine
 
Análise da escrita alfabética
Análise da escrita alfabéticaAnálise da escrita alfabética
Análise da escrita alfabéticaAnanda Lima
 
Slide linguagem Avaliação
Slide linguagem AvaliaçãoSlide linguagem Avaliação
Slide linguagem AvaliaçãoNaysa Taboada
 
Unidade 3 1º encontro direitos de língua portuguesa e concepções de escrit...
Unidade 3  1º encontro   direitos de língua portuguesa e concepções de escrit...Unidade 3  1º encontro   direitos de língua portuguesa e concepções de escrit...
Unidade 3 1º encontro direitos de língua portuguesa e concepções de escrit...Naysa Taboada
 
Métodos de alfabetização
Métodos de alfabetizaçãoMétodos de alfabetização
Métodos de alfabetizaçãoDayane Hofmann
 
Unidade 3 - PNAIC - Sistema de Escrita Alfabética
Unidade 3 - PNAIC - Sistema de Escrita AlfabéticaUnidade 3 - PNAIC - Sistema de Escrita Alfabética
Unidade 3 - PNAIC - Sistema de Escrita AlfabéticaElaine Cruz
 
Identificação dos níveis silábicos Emília Ferreiro
Identificação dos níveis silábicos Emília Ferreiro Identificação dos níveis silábicos Emília Ferreiro
Identificação dos níveis silábicos Emília Ferreiro augustafranca7
 

Destaque (20)

Delineamento Analises Multivariadas
Delineamento  Analises MultivariadasDelineamento  Analises Multivariadas
Delineamento Analises Multivariadas
 
Analise de agrupamentos uem
Analise de agrupamentos uemAnalise de agrupamentos uem
Analise de agrupamentos uem
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e Classificação
 
Aulamarcadoresgenticos 140828064451-phpapp02
Aulamarcadoresgenticos 140828064451-phpapp02Aulamarcadoresgenticos 140828064451-phpapp02
Aulamarcadoresgenticos 140828064451-phpapp02
 
Genética e Biologia Molecular
Genética e Biologia MolecularGenética e Biologia Molecular
Genética e Biologia Molecular
 
Calcogênios blog
Calcogênios blogCalcogênios blog
Calcogênios blog
 
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
 
Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1
 
Calcogênios família 6 a - química
Calcogênios   família 6 a - químicaCalcogênios   família 6 a - química
Calcogênios família 6 a - química
 
Eja metodologia políticas públicas de eja
Eja   metodologia políticas públicas de ejaEja   metodologia políticas públicas de eja
Eja metodologia políticas públicas de eja
 
Hipoteses de escrita
Hipoteses de escritaHipoteses de escrita
Hipoteses de escrita
 
Aula 30 testes de hipóteses
Aula 30   testes de hipótesesAula 30   testes de hipóteses
Aula 30 testes de hipóteses
 
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
 
Análise da escrita alfabética
Análise da escrita alfabéticaAnálise da escrita alfabética
Análise da escrita alfabética
 
Slide linguagem Avaliação
Slide linguagem AvaliaçãoSlide linguagem Avaliação
Slide linguagem Avaliação
 
Unidade 3 1º encontro direitos de língua portuguesa e concepções de escrit...
Unidade 3  1º encontro   direitos de língua portuguesa e concepções de escrit...Unidade 3  1º encontro   direitos de língua portuguesa e concepções de escrit...
Unidade 3 1º encontro direitos de língua portuguesa e concepções de escrit...
 
Níveis de escrita (1)pnaic
Níveis de escrita (1)pnaicNíveis de escrita (1)pnaic
Níveis de escrita (1)pnaic
 
Métodos de alfabetização
Métodos de alfabetizaçãoMétodos de alfabetização
Métodos de alfabetização
 
Unidade 3 - PNAIC - Sistema de Escrita Alfabética
Unidade 3 - PNAIC - Sistema de Escrita AlfabéticaUnidade 3 - PNAIC - Sistema de Escrita Alfabética
Unidade 3 - PNAIC - Sistema de Escrita Alfabética
 
Identificação dos níveis silábicos Emília Ferreiro
Identificação dos níveis silábicos Emília Ferreiro Identificação dos níveis silábicos Emília Ferreiro
Identificação dos níveis silábicos Emília Ferreiro
 

Semelhante a Análises agrupamento e dissimilaridade no Genes

Sessao 6.pdf para aproveitametno em sessões
Sessao 6.pdf para aproveitametno em sessõesSessao 6.pdf para aproveitametno em sessões
Sessao 6.pdf para aproveitametno em sessõesJoaquimOliveiraBapti1
 
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive BayesAhirton Lopes
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAdilmar Dantas
 
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...Elaine Cecília Gatto
 
Apresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasApresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasdean dundas
 
Apresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasApresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasdean dundas
 
Análise de Agrupamentos e Regionalização
Análise de Agrupamentos e RegionalizaçãoAnálise de Agrupamentos e Regionalização
Análise de Agrupamentos e RegionalizaçãoVitor Vieira Vasconcelos
 
Análise de agrupamentos e regionalização - Prática no Geoda
Análise de agrupamentos e regionalização - Prática no GeodaAnálise de agrupamentos e regionalização - Prática no Geoda
Análise de agrupamentos e regionalização - Prática no GeodaVitor Vieira Vasconcelos
 
Classificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de CorrelaçõesClassificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de CorrelaçõesElaine Cecília Gatto
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaCarlos Moura
 
Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automáticabutest
 
Algoritmos genéticos: princípios e aplicações
Algoritmos genéticos: princípios e aplicaçõesAlgoritmos genéticos: princípios e aplicações
Algoritmos genéticos: princípios e aplicaçõesXequeMateShannon
 
Scaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with HadoopScaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with HadoopJoão Gabriel Lima
 

Semelhante a Análises agrupamento e dissimilaridade no Genes (20)

Sessao 6.pdf para aproveitametno em sessões
Sessao 6.pdf para aproveitametno em sessõesSessao 6.pdf para aproveitametno em sessões
Sessao 6.pdf para aproveitametno em sessões
 
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
 
Analise de clusters
Analise de clustersAnalise de clusters
Analise de clusters
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de Emoções
 
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
 
Apresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasApresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequências
 
Apresentar dados
Apresentar dadosApresentar dados
Apresentar dados
 
Apresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasApresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequências
 
Análise de Agrupamentos e Regionalização
Análise de Agrupamentos e RegionalizaçãoAnálise de Agrupamentos e Regionalização
Análise de Agrupamentos e Regionalização
 
Análise de agrupamentos
Análise de agrupamentosAnálise de agrupamentos
Análise de agrupamentos
 
Análise de agrupamentos e regionalização - Prática no Geoda
Análise de agrupamentos e regionalização - Prática no GeodaAnálise de agrupamentos e regionalização - Prática no Geoda
Análise de agrupamentos e regionalização - Prática no Geoda
 
Classificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de CorrelaçõesClassificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de Correlações
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisa
 
Histograma
HistogramaHistograma
Histograma
 
Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automática
 
Algoritmos genéticos: princípios e aplicações
Algoritmos genéticos: princípios e aplicaçõesAlgoritmos genéticos: princípios e aplicações
Algoritmos genéticos: princípios e aplicações
 
Algoritmo genético
Algoritmo genéticoAlgoritmo genético
Algoritmo genético
 
ID3 Algorithm
ID3 AlgorithmID3 Algorithm
ID3 Algorithm
 
Estatística - Aula 2
Estatística - Aula 2Estatística - Aula 2
Estatística - Aula 2
 
Scaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with HadoopScaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with Hadoop
 

Último

Memórias_póstumas_de_Brás_Cubas_ Machado_de_Assis
Memórias_póstumas_de_Brás_Cubas_ Machado_de_AssisMemórias_póstumas_de_Brás_Cubas_ Machado_de_Assis
Memórias_póstumas_de_Brás_Cubas_ Machado_de_Assisbrunocali007
 
Hans Kelsen - Teoria Pura do Direito - Obra completa.pdf
Hans Kelsen - Teoria Pura do Direito - Obra completa.pdfHans Kelsen - Teoria Pura do Direito - Obra completa.pdf
Hans Kelsen - Teoria Pura do Direito - Obra completa.pdfrarakey779
 
Atividade com a música Xote da Alegria - Falamansa
Atividade com a música Xote  da  Alegria    -   FalamansaAtividade com a música Xote  da  Alegria    -   Falamansa
Atividade com a música Xote da Alegria - FalamansaMary Alvarenga
 
OFICINA - CAFETERIA DAS HABILIDADES.pdf_20240516_002101_0000.pdf
OFICINA - CAFETERIA DAS HABILIDADES.pdf_20240516_002101_0000.pdfOFICINA - CAFETERIA DAS HABILIDADES.pdf_20240516_002101_0000.pdf
OFICINA - CAFETERIA DAS HABILIDADES.pdf_20240516_002101_0000.pdfAndriaNascimento27
 
Slides Lição 9, CPAD, Resistindo à Tentação no Caminho, 2Tr24.pptx
Slides Lição 9, CPAD, Resistindo à Tentação no Caminho, 2Tr24.pptxSlides Lição 9, CPAD, Resistindo à Tentação no Caminho, 2Tr24.pptx
Slides Lição 9, CPAD, Resistindo à Tentação no Caminho, 2Tr24.pptxLuizHenriquedeAlmeid6
 
PERFIL M DO LUBANGO e da Administraçao_041137.pptx
PERFIL M DO LUBANGO e da Administraçao_041137.pptxPERFIL M DO LUBANGO e da Administraçao_041137.pptx
PERFIL M DO LUBANGO e da Administraçao_041137.pptxtchingando6
 
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdfGRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdfrarakey779
 
PowerPoint Folha de cálculo Excel 5 e 6 anos do ensino básico
PowerPoint Folha de cálculo Excel 5 e 6 anos do ensino básicoPowerPoint Folha de cálculo Excel 5 e 6 anos do ensino básico
PowerPoint Folha de cálculo Excel 5 e 6 anos do ensino básicoPereira801
 
Eurodeputados Portugueses 2019-2024 (nova atualização)
Eurodeputados Portugueses 2019-2024 (nova atualização)Eurodeputados Portugueses 2019-2024 (nova atualização)
Eurodeputados Portugueses 2019-2024 (nova atualização)Centro Jacques Delors
 
Atividade português 7 ano página 38 a 40
Atividade português 7 ano página 38 a 40Atividade português 7 ano página 38 a 40
Atividade português 7 ano página 38 a 40vitoriaalyce2011
 
Conteúdo sobre a formação e expansão persa
Conteúdo sobre a formação e expansão persaConteúdo sobre a formação e expansão persa
Conteúdo sobre a formação e expansão persafelipescherner
 
O autismo me ensinou - Letícia Butterfield.pdf
O autismo me ensinou - Letícia Butterfield.pdfO autismo me ensinou - Letícia Butterfield.pdf
O autismo me ensinou - Letícia Butterfield.pdfLetícia Butterfield
 
hereditariedade é variabilidade genetic
hereditariedade é variabilidade  genetichereditariedade é variabilidade  genetic
hereditariedade é variabilidade geneticMrMartnoficial
 
Poema - Reciclar é preciso
Poema            -        Reciclar é precisoPoema            -        Reciclar é preciso
Poema - Reciclar é precisoMary Alvarenga
 
ATPCG 27.05 - Recomposição de aprendizagem.pptx
ATPCG 27.05 - Recomposição de aprendizagem.pptxATPCG 27.05 - Recomposição de aprendizagem.pptx
ATPCG 27.05 - Recomposição de aprendizagem.pptxmairaviani
 
Tesis de Maestría de Pedro Sousa de Andrade (Resumen).pdf
Tesis de Maestría de Pedro Sousa de Andrade (Resumen).pdfTesis de Maestría de Pedro Sousa de Andrade (Resumen).pdf
Tesis de Maestría de Pedro Sousa de Andrade (Resumen).pdfEditora
 
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdfGRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdfrarakey779
 
Apresentação Formação em Prevenção ao Assédio
Apresentação Formação em Prevenção ao AssédioApresentação Formação em Prevenção ao Assédio
Apresentação Formação em Prevenção ao Assédioifbauab
 
04_GuiaDoCurso_Neurociência, Psicologia Positiva e Mindfulness.pdf
04_GuiaDoCurso_Neurociência, Psicologia Positiva e Mindfulness.pdf04_GuiaDoCurso_Neurociência, Psicologia Positiva e Mindfulness.pdf
04_GuiaDoCurso_Neurociência, Psicologia Positiva e Mindfulness.pdfARIANAMENDES11
 
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptxSlides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptxLuizHenriquedeAlmeid6
 

Último (20)

Memórias_póstumas_de_Brás_Cubas_ Machado_de_Assis
Memórias_póstumas_de_Brás_Cubas_ Machado_de_AssisMemórias_póstumas_de_Brás_Cubas_ Machado_de_Assis
Memórias_póstumas_de_Brás_Cubas_ Machado_de_Assis
 
Hans Kelsen - Teoria Pura do Direito - Obra completa.pdf
Hans Kelsen - Teoria Pura do Direito - Obra completa.pdfHans Kelsen - Teoria Pura do Direito - Obra completa.pdf
Hans Kelsen - Teoria Pura do Direito - Obra completa.pdf
 
Atividade com a música Xote da Alegria - Falamansa
Atividade com a música Xote  da  Alegria    -   FalamansaAtividade com a música Xote  da  Alegria    -   Falamansa
Atividade com a música Xote da Alegria - Falamansa
 
OFICINA - CAFETERIA DAS HABILIDADES.pdf_20240516_002101_0000.pdf
OFICINA - CAFETERIA DAS HABILIDADES.pdf_20240516_002101_0000.pdfOFICINA - CAFETERIA DAS HABILIDADES.pdf_20240516_002101_0000.pdf
OFICINA - CAFETERIA DAS HABILIDADES.pdf_20240516_002101_0000.pdf
 
Slides Lição 9, CPAD, Resistindo à Tentação no Caminho, 2Tr24.pptx
Slides Lição 9, CPAD, Resistindo à Tentação no Caminho, 2Tr24.pptxSlides Lição 9, CPAD, Resistindo à Tentação no Caminho, 2Tr24.pptx
Slides Lição 9, CPAD, Resistindo à Tentação no Caminho, 2Tr24.pptx
 
PERFIL M DO LUBANGO e da Administraçao_041137.pptx
PERFIL M DO LUBANGO e da Administraçao_041137.pptxPERFIL M DO LUBANGO e da Administraçao_041137.pptx
PERFIL M DO LUBANGO e da Administraçao_041137.pptx
 
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdfGRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
 
PowerPoint Folha de cálculo Excel 5 e 6 anos do ensino básico
PowerPoint Folha de cálculo Excel 5 e 6 anos do ensino básicoPowerPoint Folha de cálculo Excel 5 e 6 anos do ensino básico
PowerPoint Folha de cálculo Excel 5 e 6 anos do ensino básico
 
Eurodeputados Portugueses 2019-2024 (nova atualização)
Eurodeputados Portugueses 2019-2024 (nova atualização)Eurodeputados Portugueses 2019-2024 (nova atualização)
Eurodeputados Portugueses 2019-2024 (nova atualização)
 
Atividade português 7 ano página 38 a 40
Atividade português 7 ano página 38 a 40Atividade português 7 ano página 38 a 40
Atividade português 7 ano página 38 a 40
 
Conteúdo sobre a formação e expansão persa
Conteúdo sobre a formação e expansão persaConteúdo sobre a formação e expansão persa
Conteúdo sobre a formação e expansão persa
 
O autismo me ensinou - Letícia Butterfield.pdf
O autismo me ensinou - Letícia Butterfield.pdfO autismo me ensinou - Letícia Butterfield.pdf
O autismo me ensinou - Letícia Butterfield.pdf
 
hereditariedade é variabilidade genetic
hereditariedade é variabilidade  genetichereditariedade é variabilidade  genetic
hereditariedade é variabilidade genetic
 
Poema - Reciclar é preciso
Poema            -        Reciclar é precisoPoema            -        Reciclar é preciso
Poema - Reciclar é preciso
 
ATPCG 27.05 - Recomposição de aprendizagem.pptx
ATPCG 27.05 - Recomposição de aprendizagem.pptxATPCG 27.05 - Recomposição de aprendizagem.pptx
ATPCG 27.05 - Recomposição de aprendizagem.pptx
 
Tesis de Maestría de Pedro Sousa de Andrade (Resumen).pdf
Tesis de Maestría de Pedro Sousa de Andrade (Resumen).pdfTesis de Maestría de Pedro Sousa de Andrade (Resumen).pdf
Tesis de Maestría de Pedro Sousa de Andrade (Resumen).pdf
 
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdfGRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
GRAMÁTICA NORMATIVA DA LÍNGUA PORTUGUESA UM GUIA COMPLETO DO IDIOMA.pdf
 
Apresentação Formação em Prevenção ao Assédio
Apresentação Formação em Prevenção ao AssédioApresentação Formação em Prevenção ao Assédio
Apresentação Formação em Prevenção ao Assédio
 
04_GuiaDoCurso_Neurociência, Psicologia Positiva e Mindfulness.pdf
04_GuiaDoCurso_Neurociência, Psicologia Positiva e Mindfulness.pdf04_GuiaDoCurso_Neurociência, Psicologia Positiva e Mindfulness.pdf
04_GuiaDoCurso_Neurociência, Psicologia Positiva e Mindfulness.pdf
 
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptxSlides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
 

Análises agrupamento e dissimilaridade no Genes

  • 1. ANÁLISES DE AGRUPAMENTO E DISSIMILARIDADE Mestrando: Cristiano Lemes Prof: Giovani Benin Teoria da Seleção - 2012
  • 2. ANÁLISES QUE SERÃO ABORDADAS  Métodos de Agrupamento:  Variáveis Canônicas  Componentes Principais  Transformar matriz de similaridade em dissimilaridade  Dissimilaridade:  Distância Euclidiana (baseada no arquivo de médias)  Distância Mahalabonis (considera as repetições)  Correlação cofenética e Ponto de corte  Bootstrap e ponto de corte em dendogramas  Dissimilaridade através de marcadores:  morfológicos  Moleculares
  • 3. TÉCNICAS DE AGRUPAMENTO  Os métodos de agrupamento têm por finalidade separar um grupo original de observações em vários subgrupos, de forma a obter homogeneidade dentro e heterogeneidade entre os subgrupos.  Dentre estes métodos, os hierárquicos e os de otimização são empregados em grande escala pelos melhoristas de plantas.
  • 4. Principais análises 1 - Estimativa de uma medida de distância Distancia Euclidiana Distancia generalizada de Mahalanobis 2 - Adoção de uma técnica de agrupamento Variáveis canônicas Dispersão gráfica Componentes principais Agrupamento de Tocher Agrupamento (Vizinho mais próximo, mais distante e distância média)
  • 5. FINALIDADE: Reunir os genitores em grupos Segundo critérios de similaridade ou dissimilaridade OBJETIV Homogeneidade dentro de grupos OS: Heterogeneidade entre grupos Etapas: 1 – Estimativa das distâncias 2 – Adoção de uma técnica de agrupamento Identificação do par de genitores mais similares Avalia a possibilidade de inclusão de novos genitores
  • 6. VARIÁVEIS CANÔNICAS - Técnica de Dispersão Gráfica - exige experimento com delineamento experimental (repetições) - Para serem representativos as 2 primeiras variáveis devem explicar pelo menos 80% da variação original dos dados;
  • 7. - Abrir arquivo de médias - Em “Dispersão” completar com o “cre” - Declarar o número de variáveis - Nomear variáveis
  • 8. Nesse caso as 2 primeiras variáveis explicam mais de 80% da variação original dos dados
  • 9.
  • 10. COMPONENTES PRINCIPAIS - Técnica de Dispersão Gráfica - Permitem a identificação da divergência genética - Não exige experimentos com delineamento experimental (usa-se apenas o arquivo de médias) - Para ser representativo os 2 primeiros componentes devem explicar pelo menos 80% da variação original dos dados.
  • 11.
  • 12.
  • 13. Nesse caso os 2 primeiros componentes explicam mais de 80% da variação original dos dados
  • 14.
  • 15. C. PRINCIPAIS VS V. CANÔNICAS  SEMELHANÇAS:  Permitem a identificação da divergência genética;  Possibilidade de resumir o conjunto de variáveis originais em poucos componentes, o que significará ter uma boa aproximação do comportamento dos indivíduos de um espaço dimensional em um espaço bi ou tri dimensional;   Para serem representativos os 2 primeiros componentes devem explicar pelo menos 80% da variação original dos dados;  Os componentes são independentes entre si;  Ambas utilizam dados padronizados.
  • 16. TOCHER - Método de Agrupamento - A média das medidas de distância dentro de cada grupo deve ser menor do que as distâncias médias entre quaisquer grupo - Não permite comparar acessos dentro do mesmo do mesmo grupo
  • 17.
  • 18.
  • 19.
  • 20. DISSIMILARIDADE - DISTÂNCIA DE EUCLIDIANA Observações individuais Experimentos que não contemplam delineamento Deve ser Experimentos com delineamento - Médias das repetições evitado Menor precisão em relação a distancia generalizada de Mahalanobis
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26. - Saída do Dendograma - Desvantagem do Genes: - Pouca possibilidade para editar e formatar as figuras
  • 27.
  • 28. Dissimilaridade - Distância de Mahalanobis - Leva em conta as variâncias e covariâncias e correlações residuais entre os caracteres aferidos. -Considera as repetições experimentais -é possível destacar a distância generalizada de Mahalanobis D 2 - Leva em consideração a existência de correlações entre os caracteres analisados, Necessita de ensaios experimentais com repetições
  • 29.
  • 30. -Nomear as Variáveis - Gerar Matriz -Processar Agrupamento -Bootstrap -Testa a consistência das bifurcações em porcentagem a partir de um número determinado de simulações
  • 31.
  • 32. CONTRIBUIÇÃO RELATIVA DOS CARACTERES – SINGH 1981 Identificação dos caracteres que mais contribuíram para a dissimilaridade genética entre os genótipos avaliados
  • 33.
  • 34. Dendograma gerado a partir da matriz de distância de Mahalanobis
  • 35.
  • 36. CORRELAÇÃO COFENÉTICA (CCC) Mede a correlação (ajuste) entre a matriz de distância original e as distâncias apresentadas no dendrograma. Muito importante quando são realizadas inferências com base no dendrograma Valores de CCC acima de 0,70 indicam uma representação confiável entre a matriz de distância original e as distâncias gráficas
  • 37.
  • 38. Abrir a “matriz de distância genética” que se deseja analisar
  • 39.
  • 40. CONSTRUINDO DENDOGRAMAS NO NTSYS - Abrir a “matriz de distância genética” no Genes - Exportá-lo para o Excel - Formatá-lo conforme o modelo ao lado
  • 41. - NoNTSYS, em clustering, clicar em SAHN, e no Imput file abrir a matriz de dissimilaridade (Excel) -
  • 42. No output tree file, digitar um nome de saída (exemplo DE = dendrograma) Em Clustering methods deixar UPGMA; aí pedir para rodar (Compute), Com isso vai abrir uma janela de escritas que pode ser fechada, e após deves buscar no canto inferior esquerdo da janela uma figura pequena em forma de dendrograma: Clicando nela aparece a FIGURA que pode ser formatada conforme interesse, sendo salva formato metafile.
  • 43.
  • 44. Conforme exposto acima, o programa Ntsys possui vários mecanismos que podem ser ajustados para formatar os dendogramas da mais adequada a cada situação
  • 46. MATRIZ MAHALANOBIS - NTSYS Idem passos anteriores para construção do dendograma a partir da matriz de Distância Euclidiana
  • 47.
  • 48.
  • 49.
  • 50.
  • 51. CCC NO NTSYS Lembrar do arquivo de saída que foi salvo anteriormente
  • 52. - Antes de começar o cálculo do CCC refazer analise de dissimilaridade no Ntsys, substituindo o nome dos genótipos por letras. - Calcular a matriz cofenética a partir do dentrograma que foi salvo (DE). Isto é feito no mesmo local clustering, clicar em Cophenetic values, e em Imput tree file abrir o DE e na Output Coph file, colocar um nome de saída (CCC). - Após isso clicar em “Compute”.
  • 53. -Depois, clicar em Graphics, em seguida em Matrix comprison plot, e no Input file 1 (X) abrir a matriz de dissimilaridade do Excel, aquela do inicio, e no Input file 2 (X), abrir a matriz cofenética de nome salvo (CCC). - No Input file 3 (X) não vai nada. No Number of permutations, digitar 1000. (feito isso pedir para rodar). Vai abrir um gráfico que quando fechado aparece uma janela de escritas, e em uma delas aparece o valor da correlação entre as matrizes e que é o valor cofenético.
  • 54.
  • 55.
  • 56. CÁLCULO DE SIMILARIDADE GENÉTICA A PARTIR DE MARCADORES MOLECULARES - Juntar todos os marcadores polimórficos em única planilha do Excel - Colocar nome dos genótipos e números de códigos (exemplo 1=cálculo da similaridade; 10=número de genótipos; 182=número de marcadores utilizados)
  • 57. - No NTSYS: entrar em Similarity, depois em quantitative date e no Input file one buscar a planilha de dados do Excel com os códigos, genótipos e marcadores. - Deixar clicado X em By rows, Coefficient clicar em DICE, e em Output file escrever qualquer nome de saída do arquivo de similaridade (só escrever o nome que ele salva no mesmo lugar que foi buscada a planilha de dados anterior. - Rodar a análise (compute) e depois editar o dendograma
  • 58.
  • 59. Transformá-la em dissimilaridade genética (1 menos os valores de similaridade que abrirem Após, sem números em formato de fórmula, inserir uma coluna e duas linhas, colocando o nome dos genótipos em forma de matriz, porém, nas primeiras três células da linha digitar os códigos: 2=indica cálculo de dissimilaridade, 10 e 10= indicam a dimensão da matriz.
  • 60.
  • 61. OBRIGADO  cristianolemes.utfpr@gmail.com