SlideShare uma empresa Scribd logo
1 de 26
Baixar para ler offline
Integra¸c˜ao de dados genˆomicos e estat´ısticos
no RStudio
Leandro Nascimento Lemos
Doutorando em Biologia na Agricultura e no Ambiente
Orientadora: Profa. Tsai
Novembro/2016
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
Feedback de ontem
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
Feedback de ontem
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Introduc¸˜ao
R: Linguagem de Programac¸˜ao (Open).
Ambiente de desenvolvimento integrado para c´alculos
estat´ısticos e gr´aficos (Wikipedia).
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Introduc¸˜ao
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Leitura e manipulac¸˜ao de dados - Usando Func¸˜oes (10
minutos)
Vetor
Proteobacteria.pasto.A <- 20
ProteobacteriaAbund <- c(10,20,50)
ph.pasto <- c(4,5,6)
?mean ((ajuda!))
mean(ProteobacteriaAbund)
sd (ProteobacteriaAbund)
plot(ph, ProteobacteriaAbund)
?plot (Procurar os parˆametros para modificar o gr´afico. (Por
exemplo, modificar ProteobacteriaAbund por Proteobacteria
relative abundance).
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Leitura e manipulac¸˜ao de dados (10 minutos)
Vetor
ProteobacteriaAbund <- c(10,20,22,25,28,30)
ph <- c(4,4.5,5,5.5,6,7)
plot(ph, ProteobacteriaAbund, xlab=”pH”,
ylab=”Proteobacteria relative abundance (%)”,
col=”blue”)
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Leitura e manipulac¸˜ao de dados - Data frame (15
minutos)
Data frame: Armazenamento de tabelas (linhas e colunas).
tabela <- data.frame(ProteobacteriaAbund, ph)
Leitura de arquivos (In´umeras func¸˜oes...)
Session, Set Working Directory, Choose Directory.
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Leitura e manipulac¸˜ao de dados - Data frame (15
minutos)
abund <- read.csv(”analysis.tvs”, sep=”t”, header=TRUE,
row.names=1)
?apply
apply(abund, 2, sum) - Abundˆancia total
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: ´Indices de Diversidade
Instalar e carregar o pacote vegan.
install.packages(”vegan”)
library(”vegan”)
diversity(abund, index=”shannon”, MARGIN=2)
shannonValues <- diversity(abund, index=”shannon”,
MARGIN=2)
barplot(shannonValues)
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Diversidade Beta
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Estat´ıstica Multivariada
Padr˜oes de similaridade
Identificac¸˜ao de quais vari´aveis est˜ao influenciando nos
padr˜oes de similaridade.
Matriz de distribuic¸˜ao de esp´ecies vs. Matriz de vari´aveis
ambientais (metadados).
Grande variedade de t´ecnicas estat´ısticas...
An´alise de Coordenadas Principais (PCoA).
An´alise de Correspondˆencia Canonica (CCA).
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Estat´ıstica Multivariada
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: An´alise de Coordenadas Principais (PCoA)
Conceito de distˆancia: Quanto mais similaridade entre as
amostras, mais pr´oximas elas est˜ao entre si.
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: M´etrica de distˆancia - Bray-Curtis
Conceito de distˆancia: Quanto mais similaridade entre as
amostras, mais pr´oximas elas est˜ao entre si.
Bray-Curtis: proporc¸˜ao de similaridade ou dissimilaridade
(distˆancia) na abundˆancia das esp´ecies.
Valores entre 0 e 1.
0 (iguais).
Quanto mais pr´oximo de 1, mais dissimilar!
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: An´alise de Coordenadas Principais (PCoA)
Ideia principal: Reduzir dimens˜oes pra resumir os dados!
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: PCoA - Matriz de distˆancia - 20 minutos
1 Abrir o RStudio.
2 Carregar o pacote vegan.
3 Carregar o arquivo de abundˆancia de filos e o arquivo de
abundˆancia de func¸˜oes em objetivos separados no R.
4 Pesquisa sobre a func¸˜ao vegdist (dica: ?vegdist) e calcule as
similaridade entre cada amostra pelo M´etodo Bray-Curtis.
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: Reduc¸˜ao de Dimens˜oes - PCoA - 10 minutos
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: PCoA - Matriz de distˆancia - 20 minutos
1 Abrir o RStudio.
2 Carregar o pacote vegan.
3 ?cmdscale
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: PCoA - Matriz de distˆancia - 20 minutos
AbundPhyla <- read.csv(”analysis.tvs”, header=TRUE,
sep=”t”, row.names = 1)
AbundPhyla.d <- vegdist(t(AbundPhyla), method=”bray”)
AbundPhyla.ord <- cmdscale(AbundPhyla.d, eig=TRUE)
x <- AbundPhyla.ord$points[,1]
y <- AbundPhyla.ord$points[,2]
plot(x, y, xlab=”Coordinate 1”, ylab=”Coordinate 2”,
type=”n”)
text(x, y, labels = row.names(t(AbundPhyla)), cex=.7)
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: ggplot2 (pacote de gerac¸˜ao de gr´aficos public´aveis)
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: An´alise de Correspondˆencia Canonica (CCA)
Encontrar rela¸c˜oes entre dois conjuntos de vari´aveis X e Y.
Distribuic¸˜ao de t´axons e parˆametros ambientais (metadados, por exemplo: pH,
temperatura, umidade, etc).
O conjunto das vari´aveis resposta (Y) ´e contrastado com o conjunto das
vari´aveis explicat´orias (X).
Triplot: vari´aveis resposta s˜ao representadas por flechas e vari´aveis explicat´orias
s˜ao representadas por pontos.
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: An´alise de Correspondˆencia Canonica (CCA)
library(”vegan”)
AbundPhyla ¡- read.csv(”TaxonomyOrder.tvs”, sep=”
t”, header=TRUE, row.names=1)
quimicos ¡- read.csv(”Metadados.csv”, sep=”
t”, header=TRUE, row.names=1)
cca.calc ¡- cca(t(AbundPhyla), t(scale(quimicos)))
plot(cca.calc, choices = c(1, 2), display = c(”cn”, ”sites”),scaling = ”species”)
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
R: An´alise de Correspondˆencia Canonica (CCA) - 10
minutos
?cca
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
Discuss˜ao
Quais an´alises computacionais e m´etodos estat´ısticos eu devo
aplicar no meu estudo?
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
Obrigado pela aten¸c˜ao!
Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio

Mais conteúdo relacionado

Mais procurados

Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a BioinformáticaRicardo Leite
 
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoesSequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoesRinaldo Pereira
 
Como interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonComo interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonMarcel Caraciolo
 
Bioinformática e suas aplicações
Bioinformática e suas aplicaçõesBioinformática e suas aplicações
Bioinformática e suas aplicaçõesAlex Camargo
 
Avanços e perspectivas em Bioinformática
Avanços e perspectivas em BioinformáticaAvanços e perspectivas em Bioinformática
Avanços e perspectivas em BioinformáticaLeandro Lima
 
Construindo softwares de bioinformática para análises clínicas : Desafios e...
Construindo softwares  de bioinformática  para análises clínicas : Desafios e...Construindo softwares  de bioinformática  para análises clínicas : Desafios e...
Construindo softwares de bioinformática para análises clínicas : Desafios e...Marcel Caraciolo
 

Mais procurados (8)

Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a Bioinformática
 
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoesSequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoes
 
ACC-Bioinformatica-Seminario
ACC-Bioinformatica-SeminarioACC-Bioinformatica-Seminario
ACC-Bioinformatica-Seminario
 
Como interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonComo interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com Python
 
Bioinfo - Grad - Aula 6
Bioinfo - Grad - Aula 6Bioinfo - Grad - Aula 6
Bioinfo - Grad - Aula 6
 
Bioinformática e suas aplicações
Bioinformática e suas aplicaçõesBioinformática e suas aplicações
Bioinformática e suas aplicações
 
Avanços e perspectivas em Bioinformática
Avanços e perspectivas em BioinformáticaAvanços e perspectivas em Bioinformática
Avanços e perspectivas em Bioinformática
 
Construindo softwares de bioinformática para análises clínicas : Desafios e...
Construindo softwares  de bioinformática  para análises clínicas : Desafios e...Construindo softwares  de bioinformática  para análises clínicas : Desafios e...
Construindo softwares de bioinformática para análises clínicas : Desafios e...
 

Semelhante a Integração de dados genômicos e estatísticos no RStudio

Curso Intro à Ciência de Dados com R - 1.1 - Carga de dados
Curso Intro à Ciência de Dados com R - 1.1 - Carga de dadosCurso Intro à Ciência de Dados com R - 1.1 - Carga de dados
Curso Intro à Ciência de Dados com R - 1.1 - Carga de dadosJosé Roberto Motta Garcia
 
Curso Intro à Ciência de Dados com R - 1.2 - Tratamento de dados
Curso Intro à Ciência de Dados com R - 1.2 - Tratamento de dadosCurso Intro à Ciência de Dados com R - 1.2 - Tratamento de dados
Curso Intro à Ciência de Dados com R - 1.2 - Tratamento de dadosJosé Roberto Motta Garcia
 
Estrutura de Dados - Aula 01 - Apresentação
Estrutura de Dados  - Aula 01 - ApresentaçãoEstrutura de Dados  - Aula 01 - Apresentação
Estrutura de Dados - Aula 01 - ApresentaçãoLeinylson Fontinele
 
Introdução a Ciência de Dados
Introdução a Ciência de DadosIntrodução a Ciência de Dados
Introdução a Ciência de DadosNauber Gois
 

Semelhante a Integração de dados genômicos e estatísticos no RStudio (7)

Curso Intro à Ciência de Dados com R - 1.1 - Carga de dados
Curso Intro à Ciência de Dados com R - 1.1 - Carga de dadosCurso Intro à Ciência de Dados com R - 1.1 - Carga de dados
Curso Intro à Ciência de Dados com R - 1.1 - Carga de dados
 
Algoritmo BLAST
Algoritmo BLASTAlgoritmo BLAST
Algoritmo BLAST
 
Curso Intro à Ciência de Dados com R - 1.2 - Tratamento de dados
Curso Intro à Ciência de Dados com R - 1.2 - Tratamento de dadosCurso Intro à Ciência de Dados com R - 1.2 - Tratamento de dados
Curso Intro à Ciência de Dados com R - 1.2 - Tratamento de dados
 
Estrutura de Dados - Aula 01 - Apresentação
Estrutura de Dados  - Aula 01 - ApresentaçãoEstrutura de Dados  - Aula 01 - Apresentação
Estrutura de Dados - Aula 01 - Apresentação
 
Introdução a Ciência de Dados
Introdução a Ciência de DadosIntrodução a Ciência de Dados
Introdução a Ciência de Dados
 
Data science
Data scienceData science
Data science
 
Scc0241m01revisao
Scc0241m01revisaoScc0241m01revisao
Scc0241m01revisao
 

Mais de Leandro Lemos

UPARSE: Análises de sequências de 16S rRNA
UPARSE: Análises de sequências de 16S rRNAUPARSE: Análises de sequências de 16S rRNA
UPARSE: Análises de sequências de 16S rRNALeandro Lemos
 
Introdução ao Linux
Introdução ao LinuxIntrodução ao Linux
Introdução ao LinuxLeandro Lemos
 
Seminário de Extremófilos - Termoadaptação
Seminário de Extremófilos - TermoadaptaçãoSeminário de Extremófilos - Termoadaptação
Seminário de Extremófilos - TermoadaptaçãoLeandro Lemos
 
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...Leandro Lemos
 
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])Leandro Lemos
 
Seminário final de Introdução a Redes Booleanas Probabilísticas
Seminário final de Introdução a Redes Booleanas ProbabilísticasSeminário final de Introdução a Redes Booleanas Probabilísticas
Seminário final de Introdução a Redes Booleanas ProbabilísticasLeandro Lemos
 
Rethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing eraRethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing eraLeandro Lemos
 
Esqueleto e Locomoção de Bivalvia
Esqueleto e Locomoção de BivalviaEsqueleto e Locomoção de Bivalvia
Esqueleto e Locomoção de BivalviaLeandro Lemos
 

Mais de Leandro Lemos (8)

UPARSE: Análises de sequências de 16S rRNA
UPARSE: Análises de sequências de 16S rRNAUPARSE: Análises de sequências de 16S rRNA
UPARSE: Análises de sequências de 16S rRNA
 
Introdução ao Linux
Introdução ao LinuxIntrodução ao Linux
Introdução ao Linux
 
Seminário de Extremófilos - Termoadaptação
Seminário de Extremófilos - TermoadaptaçãoSeminário de Extremófilos - Termoadaptação
Seminário de Extremófilos - Termoadaptação
 
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
 
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
 
Seminário final de Introdução a Redes Booleanas Probabilísticas
Seminário final de Introdução a Redes Booleanas ProbabilísticasSeminário final de Introdução a Redes Booleanas Probabilísticas
Seminário final de Introdução a Redes Booleanas Probabilísticas
 
Rethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing eraRethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing era
 
Esqueleto e Locomoção de Bivalvia
Esqueleto e Locomoção de BivalviaEsqueleto e Locomoção de Bivalvia
Esqueleto e Locomoção de Bivalvia
 

Último

planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfplanejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfmaurocesarpaesalmeid
 
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...IsabelPereira2010
 
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...azulassessoria9
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...azulassessoria9
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...azulassessoria9
 
Revolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividadesRevolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividadesFabianeMartins35
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfCamillaBrito19
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividadeMary Alvarenga
 
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteCOMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteVanessaCavalcante37
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxLuizHenriquedeAlmeid6
 
INTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de ProfessorINTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de ProfessorEdvanirCosta
 
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMPRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMHELENO FAVACHO
 
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdfPRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdfprofesfrancleite
 
JOGO FATO OU FAKE - ATIVIDADE LUDICA(1).pptx
JOGO FATO OU FAKE - ATIVIDADE LUDICA(1).pptxJOGO FATO OU FAKE - ATIVIDADE LUDICA(1).pptx
JOGO FATO OU FAKE - ATIVIDADE LUDICA(1).pptxTainTorres4
 
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdfLeloIurk1
 
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfProjeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfHELENO FAVACHO
 
Atividade - Letra da música Esperando na Janela.
Atividade -  Letra da música Esperando na Janela.Atividade -  Letra da música Esperando na Janela.
Atividade - Letra da música Esperando na Janela.Mary Alvarenga
 
apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médiorosenilrucks
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...azulassessoria9
 

Último (20)

planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfplanejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
 
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
 
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
 
Revolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividadesRevolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividades
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdf
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividade
 
Bullying, sai pra lá
Bullying,  sai pra láBullying,  sai pra lá
Bullying, sai pra lá
 
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteCOMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
 
INTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de ProfessorINTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de Professor
 
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMPRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
 
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdfPRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
 
JOGO FATO OU FAKE - ATIVIDADE LUDICA(1).pptx
JOGO FATO OU FAKE - ATIVIDADE LUDICA(1).pptxJOGO FATO OU FAKE - ATIVIDADE LUDICA(1).pptx
JOGO FATO OU FAKE - ATIVIDADE LUDICA(1).pptx
 
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
 
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfProjeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
 
Atividade - Letra da música Esperando na Janela.
Atividade -  Letra da música Esperando na Janela.Atividade -  Letra da música Esperando na Janela.
Atividade - Letra da música Esperando na Janela.
 
apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médio
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
 

Integração de dados genômicos e estatísticos no RStudio

  • 1. Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio Leandro Nascimento Lemos Doutorando em Biologia na Agricultura e no Ambiente Orientadora: Profa. Tsai Novembro/2016 Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 2. Feedback de ontem Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 3. Feedback de ontem Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 4. R: Introduc¸˜ao R: Linguagem de Programac¸˜ao (Open). Ambiente de desenvolvimento integrado para c´alculos estat´ısticos e gr´aficos (Wikipedia). Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 5. R: Introduc¸˜ao Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 6. R: Leitura e manipulac¸˜ao de dados - Usando Func¸˜oes (10 minutos) Vetor Proteobacteria.pasto.A <- 20 ProteobacteriaAbund <- c(10,20,50) ph.pasto <- c(4,5,6) ?mean ((ajuda!)) mean(ProteobacteriaAbund) sd (ProteobacteriaAbund) plot(ph, ProteobacteriaAbund) ?plot (Procurar os parˆametros para modificar o gr´afico. (Por exemplo, modificar ProteobacteriaAbund por Proteobacteria relative abundance). Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 7. R: Leitura e manipulac¸˜ao de dados (10 minutos) Vetor ProteobacteriaAbund <- c(10,20,22,25,28,30) ph <- c(4,4.5,5,5.5,6,7) plot(ph, ProteobacteriaAbund, xlab=”pH”, ylab=”Proteobacteria relative abundance (%)”, col=”blue”) Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 8. R: Leitura e manipulac¸˜ao de dados - Data frame (15 minutos) Data frame: Armazenamento de tabelas (linhas e colunas). tabela <- data.frame(ProteobacteriaAbund, ph) Leitura de arquivos (In´umeras func¸˜oes...) Session, Set Working Directory, Choose Directory. Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 9. R: Leitura e manipulac¸˜ao de dados - Data frame (15 minutos) abund <- read.csv(”analysis.tvs”, sep=”t”, header=TRUE, row.names=1) ?apply apply(abund, 2, sum) - Abundˆancia total Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 10. R: ´Indices de Diversidade Instalar e carregar o pacote vegan. install.packages(”vegan”) library(”vegan”) diversity(abund, index=”shannon”, MARGIN=2) shannonValues <- diversity(abund, index=”shannon”, MARGIN=2) barplot(shannonValues) Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 11. R: Diversidade Beta Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 12. R: Estat´ıstica Multivariada Padr˜oes de similaridade Identificac¸˜ao de quais vari´aveis est˜ao influenciando nos padr˜oes de similaridade. Matriz de distribuic¸˜ao de esp´ecies vs. Matriz de vari´aveis ambientais (metadados). Grande variedade de t´ecnicas estat´ısticas... An´alise de Coordenadas Principais (PCoA). An´alise de Correspondˆencia Canonica (CCA). Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 13. R: Estat´ıstica Multivariada Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 14. R: An´alise de Coordenadas Principais (PCoA) Conceito de distˆancia: Quanto mais similaridade entre as amostras, mais pr´oximas elas est˜ao entre si. Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 15. R: M´etrica de distˆancia - Bray-Curtis Conceito de distˆancia: Quanto mais similaridade entre as amostras, mais pr´oximas elas est˜ao entre si. Bray-Curtis: proporc¸˜ao de similaridade ou dissimilaridade (distˆancia) na abundˆancia das esp´ecies. Valores entre 0 e 1. 0 (iguais). Quanto mais pr´oximo de 1, mais dissimilar! Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 16. R: An´alise de Coordenadas Principais (PCoA) Ideia principal: Reduzir dimens˜oes pra resumir os dados! Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 17. R: PCoA - Matriz de distˆancia - 20 minutos 1 Abrir o RStudio. 2 Carregar o pacote vegan. 3 Carregar o arquivo de abundˆancia de filos e o arquivo de abundˆancia de func¸˜oes em objetivos separados no R. 4 Pesquisa sobre a func¸˜ao vegdist (dica: ?vegdist) e calcule as similaridade entre cada amostra pelo M´etodo Bray-Curtis. Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 18. R: Reduc¸˜ao de Dimens˜oes - PCoA - 10 minutos Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 19. R: PCoA - Matriz de distˆancia - 20 minutos 1 Abrir o RStudio. 2 Carregar o pacote vegan. 3 ?cmdscale Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 20. R: PCoA - Matriz de distˆancia - 20 minutos AbundPhyla <- read.csv(”analysis.tvs”, header=TRUE, sep=”t”, row.names = 1) AbundPhyla.d <- vegdist(t(AbundPhyla), method=”bray”) AbundPhyla.ord <- cmdscale(AbundPhyla.d, eig=TRUE) x <- AbundPhyla.ord$points[,1] y <- AbundPhyla.ord$points[,2] plot(x, y, xlab=”Coordinate 1”, ylab=”Coordinate 2”, type=”n”) text(x, y, labels = row.names(t(AbundPhyla)), cex=.7) Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 21. R: ggplot2 (pacote de gerac¸˜ao de gr´aficos public´aveis) Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 22. R: An´alise de Correspondˆencia Canonica (CCA) Encontrar rela¸c˜oes entre dois conjuntos de vari´aveis X e Y. Distribuic¸˜ao de t´axons e parˆametros ambientais (metadados, por exemplo: pH, temperatura, umidade, etc). O conjunto das vari´aveis resposta (Y) ´e contrastado com o conjunto das vari´aveis explicat´orias (X). Triplot: vari´aveis resposta s˜ao representadas por flechas e vari´aveis explicat´orias s˜ao representadas por pontos. Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 23. R: An´alise de Correspondˆencia Canonica (CCA) library(”vegan”) AbundPhyla ¡- read.csv(”TaxonomyOrder.tvs”, sep=” t”, header=TRUE, row.names=1) quimicos ¡- read.csv(”Metadados.csv”, sep=” t”, header=TRUE, row.names=1) cca.calc ¡- cca(t(AbundPhyla), t(scale(quimicos))) plot(cca.calc, choices = c(1, 2), display = c(”cn”, ”sites”),scaling = ”species”) Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 24. R: An´alise de Correspondˆencia Canonica (CCA) - 10 minutos ?cca Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 25. Discuss˜ao Quais an´alises computacionais e m´etodos estat´ısticos eu devo aplicar no meu estudo? Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio
  • 26. Obrigado pela aten¸c˜ao! Leandro Nascimento Lemos Integra¸c˜ao de dados genˆomicos e estat´ısticos no RStudio