Este documento discute a análise da diversidade microbiana na era do sequenciamento de alto rendimento. Ele conclui que abordagens baseadas na filogenia são importantes para comparar comunidades microbianas com alta ou baixa cobertura de sequências, enquanto abordagens baseadas em unidades taxonômicas operacionais requerem alta cobertura para detectar mudanças. A quantidade de sequências necessária depende do ambiente analisado e se ele é similar ou não.
Análise da diversidade microbiana em diferentes abordagens com sequenciamento de nova geração
1. 1
Universidade Federal do Pampa
Curso de Bacharelado em Ciências Biológicas
Trabalho de Conclusão V
RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE
HIGH THROUGHPUT SEQUENCING ERA
Acadêmico: Leandro Nascimento Lemos
Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador
São Gabriel-RS
2011
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2. L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3. ~ 5%
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
1. Introdução Geral
1) dificuldade em simular inúmeras condições ambientais em meios de
cultura.
1.1. - Estimativa da diversidade microbiana
a) Anomalia de Placas
4. L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
1.1. - Estimativa da diversidade microbiana
1. Introdução Geral
b) Técnicas independentes de cultivo de micro-organismos
5. L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
1.3. Sequenciadores de nova geração
1. Introdução Geral
…
ACGTGACTGAGGCTAG
CTAGACTACTT
TATATATATACGTCGT
C
ACTGATGACTAGATTA
ACTGATTTAGATACCT
TGATTTTAAAAAAATA
Primeira
Geração
Segunda
Geração
Terceira
Geração
6. L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
16S primer
A
Bacterial DNA
16S primer
B
Barcode
primer B Barcodes 16S rRNA primer
Sample A
Barcode 1
Sample B
Barcode 2
Sample C
Barcode 3
Sample D
Barcode 4
Sample A Sample B Sample C Sample D
ModifiedfromHoffmannetal.(2007)Nucl.Acid.Res.
7. L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
1.3. Crescimento do número de sequências no RPD II e SILVA
1. Introdução Geral
-> Maior crescimento a partir de 2007 (Roesch et al., 2007).
8. L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
http://biology.uoregon.edu/people/BOHANNAN/pics/Microbes.jpg
Grande diversidade
a) O solo apresenta a maior
diversidade microbiana do
ambiente terrestre. O número de
sequências é de fundamental
importância para obtenção
de resultados confiáveis.
9. - Se o número de sequências não é representativo em um
ambiente, os resultados obtidos podem não ser válidos e
confiáveis;
- O número de sequências necessários em cada tipo de
abordagem pode variar de acordo com o teste aplicado e a
diversidade de cada ambiente.
Hipótese:
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
10. - Demonstrar que o nível de esforço amostral obtido em análises
de comparação de comunidades microbianas pode produzir
resultados distintos;
- Determinar quais os tipos de análises e inferências mais
eficientes quando temos disponível um número pequeno ou
grande de sequências obtidos por plataformas de
sequenciadores de nova geração.
Objetivos:
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
11. 2. Material e Métodos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
5
12. 2. Material & Metódos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2.1. Processamento de sequências, simulação de comunidades
microbianas e análises de Bioinformática
Eliminação de sequências
de baixa qualidade
trim.pl
Simulação de comunidades
microbianas hipotéticas
r_s_q.pl
500 500 500 500100 500 1000 5000
10000 20000
13. 2. Material & Metódos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2.2. Análises de Bioinformática
14. 2. Material & Metódos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2.3. Abordagens baseadas em táxons (taxon-based approaches)
Alinhamento de sequências
(Algoritmo de Needleman-Wunsch)
Greengenes
Mothur
Agrupamento de sequências
para formação de Unidades
Taxonômicas Operacionais
3 e 20% de dissimilaridade
Mothur
campo1 campo2 campo3
UTO1 4 8 19
UTO2 2 2 1
UTO3 0 1 34
15. 2. Material & Metódos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2.2. Abordagens baseadas em testes de hipóteses ( hypothesis
testing approaches)
Agrupamento de sequências
CD-HIT
Construção de uma árvore
filogenética
MUSCLE
Comparação de comunidades
microbianas
UNIFRAC
16. Comparação entre comunidades microbianas
ACP - Qualitativo ACP - Quantitativo
Análise de Coordenadas Principais (ACP)
17. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
Análise de Cobertura = representatividade
18. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
19. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
Florida - 5%; Antártica - 15%; Mauna Ulu - 9.3%; Pu'u Puai bare - 12.4%;
– Era esperado um número maior de sequências compartilhadas;
– Mesmo conjunto de dados.
a) indivíduos únicos ou compartilhados;
20. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
Florida - 48%; Mauna Ulu - 59%; Pu'u Puai bare - 47%;
21. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
– ---> Amostras com uma baixa cobertura não apresentam
resultados confiáveis ao ser aplicado Diagramas de Venn;
– ---> É necessário uma alta cobertura (> 90%);
22. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
---> Aumento da diversidade com o aumento do número de
sequências em uma amostra;
a) Índices de diversidade = comparação e caracterização de
comunidades microbianas
23. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
24. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
---> Sem mudanças significativas.
25. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
---> Sem mudanças significativas.
26. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
---> Sem mudanças significativas.
27. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
b) Estimador de riqueza = Chao1
28. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são
necessárias?)
– ---> Chao1 não apresenta resultados confiáveis quando
aplicado numa base de dados com um pequeno número de
sequências.
29. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– a) amostras aleatórias com a mesma intensidade amostral (4
– amostras de 500 sequências para cada ambiente);
– b) amostras aleatórias com o aumento da intensidade
amostras (100, 500, 1.000, 5.000, 10.000 e 20.000)
– c) amostras aleatórias com o aumento da intensidade
amostral (100, 500 e 20.000) para comparação de três
ambientes.
30. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
31. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– ---> (A) - 10.000 sequências são necessárias para formação de agrupamento;
– ---> (B) - Formação de agrupamentos a partir de 500 sequências.
32. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– ---> (A) e (B): sem formação de agrupamentos.
33. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– ---> Limitação: as amostras poderiam ser muito similares,
devido a uma mesma origem de base de dados;
–
– ---> Qual o nível de cobertura para comparar comunidades
microbianas de ambientes distintos?
34. 3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– (A) e (B) baixa cobertura = ambientes distintos (escala continental)
35. 4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a
diversidade microbiana?
a) Cobertura;
b) Ambiente a ser analisado.
36. 4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a
diversidade microbiana?
a) Cobertura;
Com base nos resultados de cobertura (51 - 81%) era esperado que o número
de Unidades Taxonômicas Operacionais entre as amostras fosse relativamente
alto.
É necessário ter uma cobertura (> 90%) para a aplicação dos Diagramas de
Venn
37. 4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a
diversidade microbiana?
a) Cobertura;
– Um grande porcentagem de espécies estão presentes em um número
pequeno.
38. 4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a
diversidade microbiana?
a) Normalização do número de sequências;
39. 4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a
diversidade microbiana?
a) Normalização do número de sequências;
40. 4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a
diversidade microbiana?
a) Chao1 = apenas com intensidade amostral alta
41. 4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a
diversidade microbiana?
a) Chao1 = apenas com intensidade amostral alta
42. 4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a
diversidade microbiana?
a) Baixa cobertura e abordagens filogenéticas
43. 4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a
diversidade microbiana?
b) Ambientes similares
I) ACP - quantitativo = 500 sequências
II) ACP = qualitativo = 10.000 sequências
44. 5. Conclusão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
- Abordagens baseadas na informação filogenética são de
extrema importância para a comparação de comunidades
microbianas do solo com alta ou baixa cobertura;
- Abordagens baseadas em Unidades Taxonômicas Operacionais
são úteis para detectar mudanças em UTOs específicas, mas é
necessário uma alta cobertura.
47. 47
Universidade Federal do Pampa
Curso de Bacharelado em Ciências Biológicas
Trabalho de Conclusão V
RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE
HIGH THROUGHPUT SEQUENCING ERA
Acadêmico: Leandro Nascimento Lemos
Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador
São Gabriel-RS
2011
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51