SlideShare uma empresa Scribd logo
An´alises de sequˆencias metagenˆomicas via
MG-RAST
Leandro Nascimento Lemos
Doutorando em Biologia na Agricultura e no Ambiente
Orientadora: Profa. Tsai
Novembro/2016
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Big Data
Gerac¸˜ao de dados massivos em Biologia Molecular;
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Big Data
Sequenciamento massivo gera muitos dados!
Illumina Hiseq: sequenciamento de at´e 2.000 genomas
microbianos em uma ´unica corrida.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Bioinform´atica
O que ´e: Aplicac¸˜ao da Ciˆencia
de Dados na resoluc¸˜ao de
problemas biol´ogicos;
Desafio: processar uma
avalanche de dados gerados por
sequenciadores de nova gerac¸˜ao;
Solu¸c˜ao: Produzir novas
ferramentas computacionais.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Bioinform´atica
Ferramentas de
Processamento:
Ferramentas de
Visualiza¸c˜ao:
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Bioinform´atica: Human Microbiome Project
Explorar as relac¸˜oes entre doenc¸as humanas e alterac¸˜oes na
microbiota;
Desenvolvimento de novas ferramentas de Bioinform´atica
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Bioinform´atica: Human Microbiome Project
Desenvolvimento de novas ferramentas de Bioinform´atica
(IMG/M)
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Bioinform´atica: Computadores de alto desempenho
Alta capacidade de
processamento,
armanezamento e mem´oria;
Illumina Hiseq
(18.000.000/reads por
amostra);
128 processadores e 2 TB
de mem´oria ram.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Linux
Sistema operacional livre.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Estudos de comunidades microbianas (ou de microbiomas)
T´ecnicas independentes de cultivo de microrganismos
Perfil de 16S rDNA; Metagenˆomica; Metatranscritˆomica
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Metagenˆomica pra quˆe?
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Metagenˆomica: Informac¸˜ao Taxonˆomica e Funcional
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Metagenˆomica: Pipelines
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MG-RAST: plataforma online de processamento de dados
metagenˆomicos
Acesso: http://metagenomics.anl.gov
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MG-RAST: plataforma online de processamento de dados
metagenˆomicos
Arquivos brutos (raw data) ou contigs (montagem - assembled data);
Arquivo de metadados (sample description data);
Upload: Interface gr´afica ou linha de comando.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MG-RAST
Pipeline (Fluxo de an´alise de dados).
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Arquivo em formato fastq (10 minutos)
https://lemosbioinfo.wordpress.com/material-aulapratica/
Verificar a qualidade das dez primeiras bases da primeira, segunda e
terceira sequˆencia.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Arquivo em formato fastq - Phred score
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Qualidade de sequenciamento/Remoc¸˜ao de sequˆencias de
baixa qualidade
Qualidade do sequenciamento
Software: FastQC
(http://www.bioinformatics.babraham.ac.uk/projects/fastqc)
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MG-RAST - Controle de Qualidade
4. Choose pipeline options
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MG-RAST - Upload
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MG-RAST - Upload
1. Metadata file: MetaZen tool
2. Select project.
3. Select sequence files (s)
4. Choose pipeline options
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Dereplicac¸˜ao, DRISEE e Screening
Deplica¸c˜ao e DRISSE: Removac¸˜ao de sequˆencias artificais
geradas durante o sequenciamento.
Screening: Removac¸˜ao de sequˆencias n˜ao-microbianas.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MG-RAST
Pipeline (Fluxo de an´alise de dados).
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Predic¸˜ao de Genes
Identificac¸˜ao de regi˜oes codificadoras.
ORFs (Open reading frames).
Tamanho m´edio de um gene microbiano: 950 bp.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Predic¸˜ao de Genes: Problemas
Fragmentos de sequˆencias (genes incompletos);
Erros de sequenciamento.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Soluc¸˜ao: Aprendizagem de M´aquina
Netflix.
Ensinar o computador a pensar usando exemplos.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Soluc¸˜ao: Aprendizagem de M´aquina
Ensinar o computador a pensar usando exemplos: HMMs (Modelos
Ocultos de Markov).
O que o computador precisa aprender?
A) Desvio no uso de c´odons; B) Modelos de Erros de Sequenciamento; C)
Padr˜oes de c´odon de iniciac¸˜ao e terminac¸˜ao.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MG-RAST
Pipeline (Fluxo de an´alise de dados).
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Agrupamento de amino´acidos
Agrupamento de sequˆencias prote´ıcas (90% de similaridade).
Redudac¸˜ao da complexidade computacional.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MG-RAST
Pipeline (Fluxo de an´alise de dados).
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Identificac¸˜ao de prote´ınas
Busca por sequˆencias similares em bancos de dados p´ublicos.
GenBank, SEED, IMG, UniProt, KEGG e eggNOGs.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Perfil de Abundˆancia
Best hit, Representative hit e Menor Ancestral Comum (LCA).
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
An´alise explorat´oria: Atividade em grupo (30 minutos)
1 Clique em AulaPratica2016.
2 Clique em Amostra de interesse do grupo.
3 Predicted feature (16S rDNA e prote´ınas); Unknown; failed QC.
4 Predicted Features: unknown protein; annotated protein; ribosomal RNA.
5 Analysis Statistics: Predicted Protein Features vs. Identified Protein
Features.
6 Modificar metadados.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
An´alise explorat´oria: Atividade em grupo (10 minutos)
1 Qual o filo mais abundante?
2 Qual a func¸˜ao mais abundante?
3 Qual ´e a proporc¸˜ao de Proteobacteria?
4 Qual ´e a proporc¸˜ao de Acidobacteria?
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Informac¸˜ao funcional: o que est˜ao fazendo?
COG, KO, NOG e Subsystems.
Abundˆancia de categorias funcionais.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Informac¸˜ao taxonˆomica: Quem est´a ali?
RefSeq.
Abundˆancia taxonˆomica.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
An´alises Comparativas (10 minutos)
1 Clique em Analysis.
2 Aguarde...
3 Create a new Analysis.
4 Selecionar RefSeq, KEGG, Subsystems e Silva SSU.
5 Selecionar as amostras.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
An´alises Comparativas: selec¸˜ao de parˆametros de anotac¸˜ao
1 Clicar em metadata e metadata
2 sample, add (sinal de mais): Nomes e Tratamento.
3 Parˆametros: I) e-value II) Identidade III) length IV) min.abundance.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
An´alise explorat´oria: Atividade em grupo (30 minutos)
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
An´alise explorat´oria: Atividade em grupo (10 minutos)
1 Qual o filo mais abundante?
2 Qual a func¸˜ao mais abundante?
3 A proporc¸˜ao do filo mais abundante ´e alterada quando os parˆametros de
anotac¸˜ao s˜ao modificados? Por quˆe?
4 A proporc¸˜ao da func¸˜ao mais abundante ´e alterada quando os parˆametros
de anotac¸˜ao s˜ao modificados? Por quˆe?
5 Qual ´e a proporc¸˜ao de Proteobacteria?
6 Qual ´e a proporc¸˜ao de Acidobacteria?
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
SubSystems
1 Exemplo...
2 Carbohydrate (n´ıvel 1)
3 One-carbon Metabolism (n´ıvel 2)
4 Methanogenesis (n´ıvel 3)
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
STAMP
1 Clique em Analysis
2 Export
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
STAMP
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MetaZoo
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
MetaZoo: Estrutura, Dinˆamica e Func¸˜oes Metab´olicas da
compostagem - Abordagem multi-ˆomica.
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Modelo de degradac¸˜ao de biomassa vegetal por
microrganismos na compostagem - Modelo conceitual
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
BMPOS - Ferramentas de Bioinform´atica para an´alises de
microbiomas
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Onde aprender?
Coursera: https://www.coursera.org
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Onde aprender?
Coursera: https://www.coursera.org
Gut Check: Exploring Your Microbiome
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
Obrigado pela aten¸c˜ao!
Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST

Mais conteúdo relacionado

Mais procurados

Pos Usp Ngs Big Data Parte 2
Pos Usp Ngs Big Data Parte 2Pos Usp Ngs Big Data Parte 2
Pos Usp Ngs Big Data Parte 2
Beta Campos
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
Marcos Castro
 
Minicurso 2013
Minicurso 2013Minicurso 2013
Minicurso 2013
Gabriel Fernandes
 
01_Pereira_RW_SBG
01_Pereira_RW_SBG01_Pereira_RW_SBG
01_Pereira_RW_SBG
Rinaldo Pereira
 
Aula1 controle qualidade
Aula1 controle qualidadeAula1 controle qualidade
Aula1 controle qualidade
FredericoMendes24
 
Bioinformática Introdução (Basic NGS)
Bioinformática Introdução (Basic NGS)Bioinformática Introdução (Basic NGS)
Bioinformática Introdução (Basic NGS)
Renato Puga
 
Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionais
Francisco Couto
 
Biotecnologia Genomica na era do sequenciamento de DNA em larga escala
Biotecnologia Genomica na era do sequenciamento de DNA em larga escalaBiotecnologia Genomica na era do sequenciamento de DNA em larga escala
Biotecnologia Genomica na era do sequenciamento de DNA em larga escala
Rinaldo Pereira
 
Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a Bioinformática
Ricardo Leite
 
Seminario "Efficient de novo assembly of single-cell bacterial genomes from s...
Seminario "Efficient de novo assembly of single-cell bacterial genomes from s...Seminario "Efficient de novo assembly of single-cell bacterial genomes from s...
Seminario "Efficient de novo assembly of single-cell bacterial genomes from s...
Edson Silva
 
Construindo softwares de bioinformática para análises clínicas : Desafios e...
Construindo softwares  de bioinformática  para análises clínicas : Desafios e...Construindo softwares  de bioinformática  para análises clínicas : Desafios e...
Construindo softwares de bioinformática para análises clínicas : Desafios e...
Marcel Caraciolo
 
BAG2019 - São Paulo - Turma 2
BAG2019 - São Paulo - Turma 2BAG2019 - São Paulo - Turma 2
BAG2019 - São Paulo - Turma 2
Renato Puga
 
Sequenciamento de nova geração- Curso de Inverno de Genética 2013-UFPR by Jos...
Sequenciamento de nova geração- Curso de Inverno de Genética 2013-UFPR by Jos...Sequenciamento de nova geração- Curso de Inverno de Genética 2013-UFPR by Jos...
Sequenciamento de nova geração- Curso de Inverno de Genética 2013-UFPR by Jos...
Joseph Evaristo
 
Novas tecnologias sequenciamento fronteiras biologia unb 10112010
Novas tecnologias sequenciamento fronteiras biologia unb 10112010Novas tecnologias sequenciamento fronteiras biologia unb 10112010
Novas tecnologias sequenciamento fronteiras biologia unb 10112010
Rinaldo Pereira
 
ACC-Bioinformatica-Seminario
ACC-Bioinformatica-SeminarioACC-Bioinformatica-Seminario
ACC-Bioinformatica-Seminario
António Cardoso Costa
 
Avanços e perspectivas em Bioinformática
Avanços e perspectivas em BioinformáticaAvanços e perspectivas em Bioinformática
Avanços e perspectivas em Bioinformática
Leandro Lima
 
Int. à Bioinformática (FMU - 08/05/2012)
Int. à Bioinformática (FMU - 08/05/2012)Int. à Bioinformática (FMU - 08/05/2012)
Int. à Bioinformática (FMU - 08/05/2012)
Leandro Lima
 
Bioinformática e suas aplicações
Bioinformática e suas aplicaçõesBioinformática e suas aplicações
Bioinformática e suas aplicações
Alex Camargo
 
RNAseq Analysis
RNAseq AnalysisRNAseq Analysis
RNAseq Analysis
Aureliano Bombarely
 
Como interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonComo interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com Python
Marcel Caraciolo
 

Mais procurados (20)

Pos Usp Ngs Big Data Parte 2
Pos Usp Ngs Big Data Parte 2Pos Usp Ngs Big Data Parte 2
Pos Usp Ngs Big Data Parte 2
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
 
Minicurso 2013
Minicurso 2013Minicurso 2013
Minicurso 2013
 
01_Pereira_RW_SBG
01_Pereira_RW_SBG01_Pereira_RW_SBG
01_Pereira_RW_SBG
 
Aula1 controle qualidade
Aula1 controle qualidadeAula1 controle qualidade
Aula1 controle qualidade
 
Bioinformática Introdução (Basic NGS)
Bioinformática Introdução (Basic NGS)Bioinformática Introdução (Basic NGS)
Bioinformática Introdução (Basic NGS)
 
Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionais
 
Biotecnologia Genomica na era do sequenciamento de DNA em larga escala
Biotecnologia Genomica na era do sequenciamento de DNA em larga escalaBiotecnologia Genomica na era do sequenciamento de DNA em larga escala
Biotecnologia Genomica na era do sequenciamento de DNA em larga escala
 
Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a Bioinformática
 
Seminario "Efficient de novo assembly of single-cell bacterial genomes from s...
Seminario "Efficient de novo assembly of single-cell bacterial genomes from s...Seminario "Efficient de novo assembly of single-cell bacterial genomes from s...
Seminario "Efficient de novo assembly of single-cell bacterial genomes from s...
 
Construindo softwares de bioinformática para análises clínicas : Desafios e...
Construindo softwares  de bioinformática  para análises clínicas : Desafios e...Construindo softwares  de bioinformática  para análises clínicas : Desafios e...
Construindo softwares de bioinformática para análises clínicas : Desafios e...
 
BAG2019 - São Paulo - Turma 2
BAG2019 - São Paulo - Turma 2BAG2019 - São Paulo - Turma 2
BAG2019 - São Paulo - Turma 2
 
Sequenciamento de nova geração- Curso de Inverno de Genética 2013-UFPR by Jos...
Sequenciamento de nova geração- Curso de Inverno de Genética 2013-UFPR by Jos...Sequenciamento de nova geração- Curso de Inverno de Genética 2013-UFPR by Jos...
Sequenciamento de nova geração- Curso de Inverno de Genética 2013-UFPR by Jos...
 
Novas tecnologias sequenciamento fronteiras biologia unb 10112010
Novas tecnologias sequenciamento fronteiras biologia unb 10112010Novas tecnologias sequenciamento fronteiras biologia unb 10112010
Novas tecnologias sequenciamento fronteiras biologia unb 10112010
 
ACC-Bioinformatica-Seminario
ACC-Bioinformatica-SeminarioACC-Bioinformatica-Seminario
ACC-Bioinformatica-Seminario
 
Avanços e perspectivas em Bioinformática
Avanços e perspectivas em BioinformáticaAvanços e perspectivas em Bioinformática
Avanços e perspectivas em Bioinformática
 
Int. à Bioinformática (FMU - 08/05/2012)
Int. à Bioinformática (FMU - 08/05/2012)Int. à Bioinformática (FMU - 08/05/2012)
Int. à Bioinformática (FMU - 08/05/2012)
 
Bioinformática e suas aplicações
Bioinformática e suas aplicaçõesBioinformática e suas aplicações
Bioinformática e suas aplicações
 
RNAseq Analysis
RNAseq AnalysisRNAseq Analysis
RNAseq Analysis
 
Como interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonComo interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com Python
 

Semelhante a Análises de sequências metagenômicas via MG-RAST

Qualificação de Mestrado
Qualificação de MestradoQualificação de Mestrado
Qualificação de Mestrado
Miguel Galves
 
Análise de Metagenomas com MEGAN
Análise de Metagenomas com MEGANAnálise de Metagenomas com MEGAN
Análise de Metagenomas com MEGAN
Lucas Amoroso Lopes de Carvalho
 
Apresenta
ApresentaApresenta
Inteligência Artificial em Séries Temporais na Arrecadação
Inteligência Artificial em Séries Temporais na ArrecadaçãoInteligência Artificial em Séries Temporais na Arrecadação
Inteligência Artificial em Séries Temporais na Arrecadação
Guttenberg Ferreira Passos
 
Predicting protein interaction sites from residue spatial sequence profile an...
Predicting protein interaction sites from residue spatial sequence profile an...Predicting protein interaction sites from residue spatial sequence profile an...
Predicting protein interaction sites from residue spatial sequence profile an...
Ystallonne Alves
 
02a medicao
02a medicao02a medicao
Conhecendo mineração de dados
Conhecendo mineração de dadosConhecendo mineração de dados
Conhecendo mineração de dados
Fhabiana Thieli Machado
 
Laboratório Nacional de Computação Científica
Laboratório Nacional de Computação CientíficaLaboratório Nacional de Computação Científica
Laboratório Nacional de Computação Científica
NIT Rio
 
Sabesp FME 2018
Sabesp FME 2018Sabesp FME 2018
Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...
Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...
Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...
Conferência Luso-Brasileira de Ciência Aberta
 
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Tchelinux
 
Data augmentation e transfer learning
Data augmentation e transfer learningData augmentation e transfer learning
Data augmentation e transfer learning
Cristian Muñoz
 
Anotação molecular
Anotação molecularAnotação molecular
Anotação molecular
UERGS
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Josias Oliveira
 
Bio python
Bio pythonBio python
Bio python
Péricles Miranda
 
Tutorial basico uso_de_ferramentas_do_nc (1)
Tutorial basico uso_de_ferramentas_do_nc (1)Tutorial basico uso_de_ferramentas_do_nc (1)
Tutorial basico uso_de_ferramentas_do_nc (1)
Sandro Rabelo
 
Dissertação de mestrado_livia_versao_final
Dissertação de mestrado_livia_versao_finalDissertação de mestrado_livia_versao_final
Dissertação de mestrado_livia_versao_final
Livia Fracalanza
 
Agr aula2
Agr aula2Agr aula2
UPARSE: Análises de sequências de 16S rRNA
UPARSE: Análises de sequências de 16S rRNAUPARSE: Análises de sequências de 16S rRNA
UPARSE: Análises de sequências de 16S rRNA
Leandro Lemos
 
UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE DECISÃO: Um Est...
UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE  DECISÃO: Um Est...UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE  DECISÃO: Um Est...
UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE DECISÃO: Um Est...
Andre Wirth
 

Semelhante a Análises de sequências metagenômicas via MG-RAST (20)

Qualificação de Mestrado
Qualificação de MestradoQualificação de Mestrado
Qualificação de Mestrado
 
Análise de Metagenomas com MEGAN
Análise de Metagenomas com MEGANAnálise de Metagenomas com MEGAN
Análise de Metagenomas com MEGAN
 
Apresenta
ApresentaApresenta
Apresenta
 
Inteligência Artificial em Séries Temporais na Arrecadação
Inteligência Artificial em Séries Temporais na ArrecadaçãoInteligência Artificial em Séries Temporais na Arrecadação
Inteligência Artificial em Séries Temporais na Arrecadação
 
Predicting protein interaction sites from residue spatial sequence profile an...
Predicting protein interaction sites from residue spatial sequence profile an...Predicting protein interaction sites from residue spatial sequence profile an...
Predicting protein interaction sites from residue spatial sequence profile an...
 
02a medicao
02a medicao02a medicao
02a medicao
 
Conhecendo mineração de dados
Conhecendo mineração de dadosConhecendo mineração de dados
Conhecendo mineração de dados
 
Laboratório Nacional de Computação Científica
Laboratório Nacional de Computação CientíficaLaboratório Nacional de Computação Científica
Laboratório Nacional de Computação Científica
 
Sabesp FME 2018
Sabesp FME 2018Sabesp FME 2018
Sabesp FME 2018
 
Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...
Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...
Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...
 
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
 
Data augmentation e transfer learning
Data augmentation e transfer learningData augmentation e transfer learning
Data augmentation e transfer learning
 
Anotação molecular
Anotação molecularAnotação molecular
Anotação molecular
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
 
Bio python
Bio pythonBio python
Bio python
 
Tutorial basico uso_de_ferramentas_do_nc (1)
Tutorial basico uso_de_ferramentas_do_nc (1)Tutorial basico uso_de_ferramentas_do_nc (1)
Tutorial basico uso_de_ferramentas_do_nc (1)
 
Dissertação de mestrado_livia_versao_final
Dissertação de mestrado_livia_versao_finalDissertação de mestrado_livia_versao_final
Dissertação de mestrado_livia_versao_final
 
Agr aula2
Agr aula2Agr aula2
Agr aula2
 
UPARSE: Análises de sequências de 16S rRNA
UPARSE: Análises de sequências de 16S rRNAUPARSE: Análises de sequências de 16S rRNA
UPARSE: Análises de sequências de 16S rRNA
 
UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE DECISÃO: Um Est...
UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE  DECISÃO: Um Est...UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE  DECISÃO: Um Est...
UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE DECISÃO: Um Est...
 

Mais de Leandro Lemos

Introdução ao Linux
Introdução ao LinuxIntrodução ao Linux
Introdução ao Linux
Leandro Lemos
 
Seminário de Extremófilos - Termoadaptação
Seminário de Extremófilos - TermoadaptaçãoSeminário de Extremófilos - Termoadaptação
Seminário de Extremófilos - Termoadaptação
Leandro Lemos
 
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
Leandro Lemos
 
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
Leandro Lemos
 
Seminário final de Introdução a Redes Booleanas Probabilísticas
Seminário final de Introdução a Redes Booleanas ProbabilísticasSeminário final de Introdução a Redes Booleanas Probabilísticas
Seminário final de Introdução a Redes Booleanas Probabilísticas
Leandro Lemos
 
Rethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing eraRethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing era
Leandro Lemos
 
Esqueleto e Locomoção de Bivalvia
Esqueleto e Locomoção de BivalviaEsqueleto e Locomoção de Bivalvia
Esqueleto e Locomoção de Bivalvia
Leandro Lemos
 

Mais de Leandro Lemos (7)

Introdução ao Linux
Introdução ao LinuxIntrodução ao Linux
Introdução ao Linux
 
Seminário de Extremófilos - Termoadaptação
Seminário de Extremófilos - TermoadaptaçãoSeminário de Extremófilos - Termoadaptação
Seminário de Extremófilos - Termoadaptação
 
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
Seminário final de Métodos estatísticos aplicados às Ciências Biológicas - MA...
 
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
Arquéias oxidadoras de amônia (Seminário final de Ecologia Microbiana [Usp])
 
Seminário final de Introdução a Redes Booleanas Probabilísticas
Seminário final de Introdução a Redes Booleanas ProbabilísticasSeminário final de Introdução a Redes Booleanas Probabilísticas
Seminário final de Introdução a Redes Booleanas Probabilísticas
 
Rethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing eraRethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing era
 
Esqueleto e Locomoção de Bivalvia
Esqueleto e Locomoção de BivalviaEsqueleto e Locomoção de Bivalvia
Esqueleto e Locomoção de Bivalvia
 

Último

Egito antigo resumo - aula de história.pdf
Egito antigo resumo - aula de história.pdfEgito antigo resumo - aula de história.pdf
Egito antigo resumo - aula de história.pdf
sthefanydesr
 
Redação e Leitura_7º ano_58_Produção de cordel .pptx
Redação e Leitura_7º ano_58_Produção de cordel .pptxRedação e Leitura_7º ano_58_Produção de cordel .pptx
Redação e Leitura_7º ano_58_Produção de cordel .pptx
DECIOMAURINARAMOS
 
Estrutura Pedagógica - Laboratório de Educação a Distância.ppt
Estrutura Pedagógica - Laboratório de Educação a Distância.pptEstrutura Pedagógica - Laboratório de Educação a Distância.ppt
Estrutura Pedagógica - Laboratório de Educação a Distância.ppt
livrosjovert
 
Famílias Que Contribuíram Para O Crescimento Do Assaré
Famílias Que Contribuíram Para O Crescimento Do AssaréFamílias Que Contribuíram Para O Crescimento Do Assaré
Famílias Que Contribuíram Para O Crescimento Do Assaré
profesfrancleite
 
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdfCaderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
enpfilosofiaufu
 
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
SILVIAREGINANAZARECA
 
Vogais Ilustrados para alfabetização infantil
Vogais Ilustrados para alfabetização infantilVogais Ilustrados para alfabetização infantil
Vogais Ilustrados para alfabetização infantil
mamaeieby
 
Introdução à Sociologia: caça-palavras na escola
Introdução à Sociologia: caça-palavras na escolaIntrodução à Sociologia: caça-palavras na escola
Introdução à Sociologia: caça-palavras na escola
Professor Belinaso
 
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
AntnioManuelAgdoma
 
Educação trabalho HQ em sala de aula uma excelente ideia
Educação  trabalho HQ em sala de aula uma excelente  ideiaEducação  trabalho HQ em sala de aula uma excelente  ideia
Educação trabalho HQ em sala de aula uma excelente ideia
joseanesouza36
 
QUIZ - HISTÓRIA 9º ANO - PRIMEIRA REPÚBLICA_ERA VARGAS.pptx
QUIZ - HISTÓRIA  9º ANO - PRIMEIRA REPÚBLICA_ERA VARGAS.pptxQUIZ - HISTÓRIA  9º ANO - PRIMEIRA REPÚBLICA_ERA VARGAS.pptx
QUIZ - HISTÓRIA 9º ANO - PRIMEIRA REPÚBLICA_ERA VARGAS.pptx
AntonioVieira539017
 
Atividades de Inglês e Espanhol para Imprimir - Alfabetinho
Atividades de Inglês e Espanhol para Imprimir - AlfabetinhoAtividades de Inglês e Espanhol para Imprimir - Alfabetinho
Atividades de Inglês e Espanhol para Imprimir - Alfabetinho
MateusTavares54
 
Pintura Romana .pptx
Pintura Romana                     .pptxPintura Romana                     .pptx
Pintura Romana .pptx
TomasSousa7
 
UFCD_10949_Lojas e-commerce no-code_índice.pdf
UFCD_10949_Lojas e-commerce no-code_índice.pdfUFCD_10949_Lojas e-commerce no-code_índice.pdf
UFCD_10949_Lojas e-commerce no-code_índice.pdf
Manuais Formação
 
Rimas, Luís Vaz de Camões. pptx
Rimas, Luís Vaz de Camões.          pptxRimas, Luís Vaz de Camões.          pptx
Rimas, Luís Vaz de Camões. pptx
TomasSousa7
 
Folheto | Centro de Informação Europeia Jacques Delors (junho/2024)
Folheto | Centro de Informação Europeia Jacques Delors (junho/2024)Folheto | Centro de Informação Europeia Jacques Delors (junho/2024)
Folheto | Centro de Informação Europeia Jacques Delors (junho/2024)
Centro Jacques Delors
 
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptxSlides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
LuizHenriquedeAlmeid6
 
Slides Lição 11, Central Gospel, Os Mortos Em CRISTO, 2Tr24.pptx
Slides Lição 11, Central Gospel, Os Mortos Em CRISTO, 2Tr24.pptxSlides Lição 11, Central Gospel, Os Mortos Em CRISTO, 2Tr24.pptx
Slides Lição 11, Central Gospel, Os Mortos Em CRISTO, 2Tr24.pptx
LuizHenriquedeAlmeid6
 
Atividade letra da música - Espalhe Amor, Anavitória.
Atividade letra da música - Espalhe  Amor, Anavitória.Atividade letra da música - Espalhe  Amor, Anavitória.
Atividade letra da música - Espalhe Amor, Anavitória.
Mary Alvarenga
 
apresentação sobre Clarice Lispector .pptx
apresentação sobre Clarice Lispector .pptxapresentação sobre Clarice Lispector .pptx
apresentação sobre Clarice Lispector .pptx
JuliaMachado73
 

Último (20)

Egito antigo resumo - aula de história.pdf
Egito antigo resumo - aula de história.pdfEgito antigo resumo - aula de história.pdf
Egito antigo resumo - aula de história.pdf
 
Redação e Leitura_7º ano_58_Produção de cordel .pptx
Redação e Leitura_7º ano_58_Produção de cordel .pptxRedação e Leitura_7º ano_58_Produção de cordel .pptx
Redação e Leitura_7º ano_58_Produção de cordel .pptx
 
Estrutura Pedagógica - Laboratório de Educação a Distância.ppt
Estrutura Pedagógica - Laboratório de Educação a Distância.pptEstrutura Pedagógica - Laboratório de Educação a Distância.ppt
Estrutura Pedagógica - Laboratório de Educação a Distância.ppt
 
Famílias Que Contribuíram Para O Crescimento Do Assaré
Famílias Que Contribuíram Para O Crescimento Do AssaréFamílias Que Contribuíram Para O Crescimento Do Assaré
Famílias Que Contribuíram Para O Crescimento Do Assaré
 
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdfCaderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
 
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
 
Vogais Ilustrados para alfabetização infantil
Vogais Ilustrados para alfabetização infantilVogais Ilustrados para alfabetização infantil
Vogais Ilustrados para alfabetização infantil
 
Introdução à Sociologia: caça-palavras na escola
Introdução à Sociologia: caça-palavras na escolaIntrodução à Sociologia: caça-palavras na escola
Introdução à Sociologia: caça-palavras na escola
 
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
 
Educação trabalho HQ em sala de aula uma excelente ideia
Educação  trabalho HQ em sala de aula uma excelente  ideiaEducação  trabalho HQ em sala de aula uma excelente  ideia
Educação trabalho HQ em sala de aula uma excelente ideia
 
QUIZ - HISTÓRIA 9º ANO - PRIMEIRA REPÚBLICA_ERA VARGAS.pptx
QUIZ - HISTÓRIA  9º ANO - PRIMEIRA REPÚBLICA_ERA VARGAS.pptxQUIZ - HISTÓRIA  9º ANO - PRIMEIRA REPÚBLICA_ERA VARGAS.pptx
QUIZ - HISTÓRIA 9º ANO - PRIMEIRA REPÚBLICA_ERA VARGAS.pptx
 
Atividades de Inglês e Espanhol para Imprimir - Alfabetinho
Atividades de Inglês e Espanhol para Imprimir - AlfabetinhoAtividades de Inglês e Espanhol para Imprimir - Alfabetinho
Atividades de Inglês e Espanhol para Imprimir - Alfabetinho
 
Pintura Romana .pptx
Pintura Romana                     .pptxPintura Romana                     .pptx
Pintura Romana .pptx
 
UFCD_10949_Lojas e-commerce no-code_índice.pdf
UFCD_10949_Lojas e-commerce no-code_índice.pdfUFCD_10949_Lojas e-commerce no-code_índice.pdf
UFCD_10949_Lojas e-commerce no-code_índice.pdf
 
Rimas, Luís Vaz de Camões. pptx
Rimas, Luís Vaz de Camões.          pptxRimas, Luís Vaz de Camões.          pptx
Rimas, Luís Vaz de Camões. pptx
 
Folheto | Centro de Informação Europeia Jacques Delors (junho/2024)
Folheto | Centro de Informação Europeia Jacques Delors (junho/2024)Folheto | Centro de Informação Europeia Jacques Delors (junho/2024)
Folheto | Centro de Informação Europeia Jacques Delors (junho/2024)
 
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptxSlides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
 
Slides Lição 11, Central Gospel, Os Mortos Em CRISTO, 2Tr24.pptx
Slides Lição 11, Central Gospel, Os Mortos Em CRISTO, 2Tr24.pptxSlides Lição 11, Central Gospel, Os Mortos Em CRISTO, 2Tr24.pptx
Slides Lição 11, Central Gospel, Os Mortos Em CRISTO, 2Tr24.pptx
 
Atividade letra da música - Espalhe Amor, Anavitória.
Atividade letra da música - Espalhe  Amor, Anavitória.Atividade letra da música - Espalhe  Amor, Anavitória.
Atividade letra da música - Espalhe Amor, Anavitória.
 
apresentação sobre Clarice Lispector .pptx
apresentação sobre Clarice Lispector .pptxapresentação sobre Clarice Lispector .pptx
apresentação sobre Clarice Lispector .pptx
 

Análises de sequências metagenômicas via MG-RAST

  • 1. An´alises de sequˆencias metagenˆomicas via MG-RAST Leandro Nascimento Lemos Doutorando em Biologia na Agricultura e no Ambiente Orientadora: Profa. Tsai Novembro/2016 Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 2. Big Data Gerac¸˜ao de dados massivos em Biologia Molecular; Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 3. Big Data Sequenciamento massivo gera muitos dados! Illumina Hiseq: sequenciamento de at´e 2.000 genomas microbianos em uma ´unica corrida. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 4. Bioinform´atica O que ´e: Aplicac¸˜ao da Ciˆencia de Dados na resoluc¸˜ao de problemas biol´ogicos; Desafio: processar uma avalanche de dados gerados por sequenciadores de nova gerac¸˜ao; Solu¸c˜ao: Produzir novas ferramentas computacionais. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 5. Bioinform´atica Ferramentas de Processamento: Ferramentas de Visualiza¸c˜ao: Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 6. Bioinform´atica: Human Microbiome Project Explorar as relac¸˜oes entre doenc¸as humanas e alterac¸˜oes na microbiota; Desenvolvimento de novas ferramentas de Bioinform´atica Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 7. Bioinform´atica: Human Microbiome Project Desenvolvimento de novas ferramentas de Bioinform´atica (IMG/M) Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 8. Bioinform´atica: Computadores de alto desempenho Alta capacidade de processamento, armanezamento e mem´oria; Illumina Hiseq (18.000.000/reads por amostra); 128 processadores e 2 TB de mem´oria ram. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 9. Linux Sistema operacional livre. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 10. Estudos de comunidades microbianas (ou de microbiomas) T´ecnicas independentes de cultivo de microrganismos Perfil de 16S rDNA; Metagenˆomica; Metatranscritˆomica Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 11. Metagenˆomica pra quˆe? Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 12. Metagenˆomica: Informac¸˜ao Taxonˆomica e Funcional Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 13. Metagenˆomica: Pipelines Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 14. MG-RAST: plataforma online de processamento de dados metagenˆomicos Acesso: http://metagenomics.anl.gov Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 15. MG-RAST: plataforma online de processamento de dados metagenˆomicos Arquivos brutos (raw data) ou contigs (montagem - assembled data); Arquivo de metadados (sample description data); Upload: Interface gr´afica ou linha de comando. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 16. MG-RAST Pipeline (Fluxo de an´alise de dados). Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 17. Arquivo em formato fastq (10 minutos) https://lemosbioinfo.wordpress.com/material-aulapratica/ Verificar a qualidade das dez primeiras bases da primeira, segunda e terceira sequˆencia. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 18. Arquivo em formato fastq - Phred score Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 19. Qualidade de sequenciamento/Remoc¸˜ao de sequˆencias de baixa qualidade Qualidade do sequenciamento Software: FastQC (http://www.bioinformatics.babraham.ac.uk/projects/fastqc) Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 20. MG-RAST - Controle de Qualidade 4. Choose pipeline options Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 21. MG-RAST - Upload Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 22. MG-RAST - Upload 1. Metadata file: MetaZen tool 2. Select project. 3. Select sequence files (s) 4. Choose pipeline options Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 23. Dereplicac¸˜ao, DRISEE e Screening Deplica¸c˜ao e DRISSE: Removac¸˜ao de sequˆencias artificais geradas durante o sequenciamento. Screening: Removac¸˜ao de sequˆencias n˜ao-microbianas. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 24. MG-RAST Pipeline (Fluxo de an´alise de dados). Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 25. Predic¸˜ao de Genes Identificac¸˜ao de regi˜oes codificadoras. ORFs (Open reading frames). Tamanho m´edio de um gene microbiano: 950 bp. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 26. Predic¸˜ao de Genes: Problemas Fragmentos de sequˆencias (genes incompletos); Erros de sequenciamento. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 27. Soluc¸˜ao: Aprendizagem de M´aquina Netflix. Ensinar o computador a pensar usando exemplos. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 28. Soluc¸˜ao: Aprendizagem de M´aquina Ensinar o computador a pensar usando exemplos: HMMs (Modelos Ocultos de Markov). O que o computador precisa aprender? A) Desvio no uso de c´odons; B) Modelos de Erros de Sequenciamento; C) Padr˜oes de c´odon de iniciac¸˜ao e terminac¸˜ao. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 29. MG-RAST Pipeline (Fluxo de an´alise de dados). Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 30. Agrupamento de amino´acidos Agrupamento de sequˆencias prote´ıcas (90% de similaridade). Redudac¸˜ao da complexidade computacional. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 31. MG-RAST Pipeline (Fluxo de an´alise de dados). Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 32. Identificac¸˜ao de prote´ınas Busca por sequˆencias similares em bancos de dados p´ublicos. GenBank, SEED, IMG, UniProt, KEGG e eggNOGs. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 33. Perfil de Abundˆancia Best hit, Representative hit e Menor Ancestral Comum (LCA). Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 34. An´alise explorat´oria: Atividade em grupo (30 minutos) 1 Clique em AulaPratica2016. 2 Clique em Amostra de interesse do grupo. 3 Predicted feature (16S rDNA e prote´ınas); Unknown; failed QC. 4 Predicted Features: unknown protein; annotated protein; ribosomal RNA. 5 Analysis Statistics: Predicted Protein Features vs. Identified Protein Features. 6 Modificar metadados. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 35. An´alise explorat´oria: Atividade em grupo (10 minutos) 1 Qual o filo mais abundante? 2 Qual a func¸˜ao mais abundante? 3 Qual ´e a proporc¸˜ao de Proteobacteria? 4 Qual ´e a proporc¸˜ao de Acidobacteria? Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 36. Informac¸˜ao funcional: o que est˜ao fazendo? COG, KO, NOG e Subsystems. Abundˆancia de categorias funcionais. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 37. Informac¸˜ao taxonˆomica: Quem est´a ali? RefSeq. Abundˆancia taxonˆomica. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 38. An´alises Comparativas (10 minutos) 1 Clique em Analysis. 2 Aguarde... 3 Create a new Analysis. 4 Selecionar RefSeq, KEGG, Subsystems e Silva SSU. 5 Selecionar as amostras. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 39. An´alises Comparativas: selec¸˜ao de parˆametros de anotac¸˜ao 1 Clicar em metadata e metadata 2 sample, add (sinal de mais): Nomes e Tratamento. 3 Parˆametros: I) e-value II) Identidade III) length IV) min.abundance. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 40. An´alise explorat´oria: Atividade em grupo (30 minutos) Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 41. An´alise explorat´oria: Atividade em grupo (10 minutos) 1 Qual o filo mais abundante? 2 Qual a func¸˜ao mais abundante? 3 A proporc¸˜ao do filo mais abundante ´e alterada quando os parˆametros de anotac¸˜ao s˜ao modificados? Por quˆe? 4 A proporc¸˜ao da func¸˜ao mais abundante ´e alterada quando os parˆametros de anotac¸˜ao s˜ao modificados? Por quˆe? 5 Qual ´e a proporc¸˜ao de Proteobacteria? 6 Qual ´e a proporc¸˜ao de Acidobacteria? Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 42. SubSystems 1 Exemplo... 2 Carbohydrate (n´ıvel 1) 3 One-carbon Metabolism (n´ıvel 2) 4 Methanogenesis (n´ıvel 3) Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 43. STAMP 1 Clique em Analysis 2 Export Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 44. STAMP Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 45. MetaZoo Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 46. MetaZoo: Estrutura, Dinˆamica e Func¸˜oes Metab´olicas da compostagem - Abordagem multi-ˆomica. Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 47. Modelo de degradac¸˜ao de biomassa vegetal por microrganismos na compostagem - Modelo conceitual Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 48. BMPOS - Ferramentas de Bioinform´atica para an´alises de microbiomas Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 49. Onde aprender? Coursera: https://www.coursera.org Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 50. Onde aprender? Coursera: https://www.coursera.org Gut Check: Exploring Your Microbiome Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST
  • 51. Obrigado pela aten¸c˜ao! Leandro Nascimento Lemos An´alises de sequˆencias metagenˆomicas via MG-RAST