SlideShare uma empresa Scribd logo
1 de 1
Baixar para ler offline
George Carvalhoa
, Wilder Galvãoa
, Marcel Caracioloa
,
Rodrigo Alexandrea
, Nara Diniza
, Renata Moldenhauerb
, João B Oliveiraa
a
Genomika Diagnósticos, Recife-PE; b
Hospital Israelita Albert Einstein, São Paulo - SP
Detecção de CNVs por NGS: validação de pipeline de
bioinformática para painéis genéticos
INTRODUção e MOTIVAção
O diagnóstico molecular de doenças genéticas é, atualmente, ferramenta
indispensável para o seguimento clínico adequado dos pacientes e para o
aconselhamento genético familiar. Variações no número de cópias (CNVs)
são segmentos do DNA que foram deletados ou duplicados em tamanho
maior que 50 pares de bases, podendo representar até 10% dos casos de
câncer hereditário e 14% dos casos de doenças genéticas pediátricas [1, 2, 3].
Com o custo e a complexidade na análise dos dados gerados pelo
sequenciamento de genoma completo (WGS), o sequenciamento de exoma
(WES) e o de amplicons têm se tornado as principais metodologias com
propósito diagnóstico usando sequenciamento de nova geração (NGS). Essas
técnicas têm demonstrado alta capacidade na identificação de variantes de
nucleotídeo únicos (SNVs) e pequenas inserções/deleções (INDELS) raras,
porém a identificação de grandes deleções e duplicações são menos
confidentes nessas técnicas quando comparadas a utilização do WGS, da
hibridização genômica comparativa baseada em microarranjos (aCGH) e da
amplificação de múltiplas sondas dependentes de ligação (MLPA) [4].
Para que painéis genéticos e o sequenciamento de exoma substituam essas
outras metodologias é necessário um software ou a combinação de
softwares que detectam CNVs por exons com alta sensibilidade,
especificidade e uma taxa de falso-positivos aceitável. Com isso, iniciamos o
desenvolvimento de pipelines para a detecção de CNVs em painéis e exomas
possibilitando o aumento de casos clínicos elucidados.
As amostras foram sequenciadas na Genomika Diagnósticos utilizando o kit Qiagen V3, que usa em
seu protocolo barcodes moleculares. Esta etapa possibilita uma melhor acurácia na descoberta de
SNVs e mantém uma homogeneidade na quantidade de leituras observadas. Através de um
benchmark prévio entre o ExomeDepth e o CoNVaDING foi possível selecionar o primeiro software a
ser utilizado em nossas rotinas. O ExomeDepth obteve 100% de acurácia, precisão, sensitividade e
especificidade em nosso estudo prévio. Porém, com o uso em rotina foi possível perceber um aumento
gradual na taxa de falso-positivos [5]. Todas as amostras utilizadas no benchmark anterior somadas as
amostras confirmadas como falso-positivas por MLPA (n=29), foram reprocessadas após a introdução
do software UMItools que permite extrair apenas os barcodes moleculares únicos para a análise de
cobertura [6].
bioinfo@genomika.com.br | genomika.com.br
Recife, PE / São Paulo, SP | Brazil
MÉTODoS
REFERÊNCIAS
1. Alkan, Can, Bradley P. Coe, and Evan E. Eichler. "Genome structural variation discovery and genotyping."
Nature Reviews Genetics 12.5 (2011): 363.
2. Shlien, Adam, and David Malkin. "Copy number variations and cancer." Genome medicine 1.6 (2009): 62.
3. Cooper, Gregory M., et al. "A copy number variation morbidity map of developmental delay." Nature genetics
43.9 (2011): 838.
4. Ellingford, Jamie M., et al. "Validation of copy number variation analysis for next-generation sequencing
diagnostics." European Journal of Human Genetics 25.6 (2017): 719
5. Carvalho, George; et al. “Improving variant accuracy with copy number variant pipeline for target
sequencing” - https://bit.ly/2jRNKC5
6. Smith, Tom, Andreas Heger, and Ian Sudbery. "UMI-tools: modeling sequencing errors in Unique Molecular
Identifiers to improve quantification accuracy." Genome research 27.3 (2017): 491-499.
BENCHMARK
Com a introdução do processo de extração de barcodes moleculares foi possível diminuir a taxa de
falso-positivos para zero dentro do conjunto de amostras com confirmações de MLPA disponíveis no
laboratório. Nossos resultados demonstram a importância da utilização de ferramentas para a
detecção de CNVs na rotina clínica, limitando o uso de metodologias padrão-ouro como o MLPA apenas
paras as amostras com variantes encontradas com pipeline de bioinformática para detecção de CNVs.
Todavia, é necessário realizar mais validações com um número maior de amostras testadas antes de
implementar totalmente essa metodologia. Adicionalmente, como indicado nas boas práticas para
bioinformática clínica, pretendemos testar outras ferramentas para que se tenha mais de um software
para detecção de CNVs com respaldo clínico.
DISCUSSÃO E CONCLUSÃO
Figura 1: Classes de CNVs possíveis de serem identificadas usando algoritmos de leitura
de cobertura disponíveis para sequenciamento de amplicons.
Figura 2: Processos internalizados para a identificação de CNVs usando painéis genéticos.
Tabela 1: Benchmark entre antes e depois da implantação do UMItools. Foram usados cálculos estatísticos derivados
da matriz de confusão. Contagem de verdadeiro-positivos (VP), verdadeiro-negativos (VN), falso-positivos (FP) e
falso-negativos (FN) foi baseada na quantidade amostras com confirmações por MLPA (n=29).
VPPipeline
12
VN
15
FP
2
FN
0
Acurácia
93,10%
Precisão
85,71%
Sensibilidade
100%
Especificidade
88,23%
12 17 0 0 100% 100% 100% 100%
UMIs
duplicados
Apenas UMIs
únicos
Cutadapt
trimming de
qualidade
BWA-MEM
mapeamento
de sequências
SamTools
conversão de
formatos
Picard
marcação de
duplicatas
UMI TOOLS
BAM apenas com
UMIs alinhados
GATK
realinhamento local de intervalos, realinhamento local entre INDELs,
recalibração de pontuação de qualidade por base, chamada de SNPs
Annovar
Anotações de
variantes
ExomeDepth
Detecção de CNVs
cnvScan
Anotação de CNVs
Arquivo VCF
SNVs e INDELs
input
fastq
FASTQC
(controle de qualidade)
DELEÇÃO
Ref.
DUPLICAÇÃO EM TANDEM
Ref.
DUPLICAÇÃO INTERCALADA
Ref.
Interpretação e
Confirmação

Mais conteúdo relacionado

Semelhante a Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéis genéticos.

Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionaisFrancisco Couto
 
Comparação da acurácia diagnóstica de testes diagnósticos comerciais imunocro...
Comparação da acurácia diagnóstica de testes diagnósticos comerciais imunocro...Comparação da acurácia diagnóstica de testes diagnósticos comerciais imunocro...
Comparação da acurácia diagnóstica de testes diagnósticos comerciais imunocro...REBRATSoficial
 
TCC Bioinfomática - Genômica da Dengue
TCC Bioinfomática - Genômica da DengueTCC Bioinfomática - Genômica da Dengue
TCC Bioinfomática - Genômica da DengueThiego de Oliveira
 
Ciência de dados para a saúde: a importância da interdisciplinaridade e da in...
Ciência de dados para a saúde: a importância da interdisciplinaridade e da in...Ciência de dados para a saúde: a importância da interdisciplinaridade e da in...
Ciência de dados para a saúde: a importância da interdisciplinaridade e da in...Fabrício A. B. da Silva
 
Minicurso 2 - "Metodologias Inovadoras para ensaios diagnósticos"
Minicurso 2 - "Metodologias Inovadoras para ensaios diagnósticos"Minicurso 2 - "Metodologias Inovadoras para ensaios diagnósticos"
Minicurso 2 - "Metodologias Inovadoras para ensaios diagnósticos"JOFARUFPR
 
Uma abordagem computacional para a determinação de polimorfismos de base única
Uma abordagem computacional para a determinação de polimorfismos de base únicaUma abordagem computacional para a determinação de polimorfismos de base única
Uma abordagem computacional para a determinação de polimorfismos de base únicaMiguel Galves
 
X pert word_22_fev2012
X pert word_22_fev2012X pert word_22_fev2012
X pert word_22_fev2012oticspedra2012
 
Aula introducaoatecnicasdediagnosticomolecular3-120325153120-phpapp02
Aula introducaoatecnicasdediagnosticomolecular3-120325153120-phpapp02Aula introducaoatecnicasdediagnosticomolecular3-120325153120-phpapp02
Aula introducaoatecnicasdediagnosticomolecular3-120325153120-phpapp02Leriaagro
 
Métodos de Investigação Epidemiológica
Métodos de Investigação Epidemiológica Métodos de Investigação Epidemiológica
Métodos de Investigação Epidemiológica Daniela Frizon Alfieri
 
Estudo endoretal da próstata com realização de ecodoppler a cores indentifica...
Estudo endoretal da próstata com realização de ecodoppler a cores indentifica...Estudo endoretal da próstata com realização de ecodoppler a cores indentifica...
Estudo endoretal da próstata com realização de ecodoppler a cores indentifica...Urovideo.org
 
ulsd729961_td_Pedro_Salgueiro.pdf
ulsd729961_td_Pedro_Salgueiro.pdfulsd729961_td_Pedro_Salgueiro.pdf
ulsd729961_td_Pedro_Salgueiro.pdfJoana Cordeiro
 
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoesSequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoesRinaldo Pereira
 

Semelhante a Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéis genéticos. (20)

Técnicas Moleculares
Técnicas MolecularesTécnicas Moleculares
Técnicas Moleculares
 
Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionais
 
Comparação da acurácia diagnóstica de testes diagnósticos comerciais imunocro...
Comparação da acurácia diagnóstica de testes diagnósticos comerciais imunocro...Comparação da acurácia diagnóstica de testes diagnósticos comerciais imunocro...
Comparação da acurácia diagnóstica de testes diagnósticos comerciais imunocro...
 
Avanços biotecnológicos 2008
Avanços biotecnológicos   2008Avanços biotecnológicos   2008
Avanços biotecnológicos 2008
 
TCC Bioinfomática - Genômica da Dengue
TCC Bioinfomática - Genômica da DengueTCC Bioinfomática - Genômica da Dengue
TCC Bioinfomática - Genômica da Dengue
 
Ciência de dados para a saúde: a importância da interdisciplinaridade e da in...
Ciência de dados para a saúde: a importância da interdisciplinaridade e da in...Ciência de dados para a saúde: a importância da interdisciplinaridade e da in...
Ciência de dados para a saúde: a importância da interdisciplinaridade e da in...
 
Minicurso 2 - "Metodologias Inovadoras para ensaios diagnósticos"
Minicurso 2 - "Metodologias Inovadoras para ensaios diagnósticos"Minicurso 2 - "Metodologias Inovadoras para ensaios diagnósticos"
Minicurso 2 - "Metodologias Inovadoras para ensaios diagnósticos"
 
Hpv
HpvHpv
Hpv
 
37º Congresso Brasileiro de Medicina Farmacêutica | Dr. Arnaldo Colombo
37º Congresso Brasileiro de Medicina Farmacêutica | Dr. Arnaldo Colombo37º Congresso Brasileiro de Medicina Farmacêutica | Dr. Arnaldo Colombo
37º Congresso Brasileiro de Medicina Farmacêutica | Dr. Arnaldo Colombo
 
diagnostico de hepatite c
diagnostico de hepatite cdiagnostico de hepatite c
diagnostico de hepatite c
 
Fatana 2012
Fatana 2012Fatana 2012
Fatana 2012
 
Uma abordagem computacional para a determinação de polimorfismos de base única
Uma abordagem computacional para a determinação de polimorfismos de base únicaUma abordagem computacional para a determinação de polimorfismos de base única
Uma abordagem computacional para a determinação de polimorfismos de base única
 
X pert word_22_fev2012
X pert word_22_fev2012X pert word_22_fev2012
X pert word_22_fev2012
 
Api desenvolvimentodedotblot
Api desenvolvimentodedotblotApi desenvolvimentodedotblot
Api desenvolvimentodedotblot
 
Aula introducaoatecnicasdediagnosticomolecular3-120325153120-phpapp02
Aula introducaoatecnicasdediagnosticomolecular3-120325153120-phpapp02Aula introducaoatecnicasdediagnosticomolecular3-120325153120-phpapp02
Aula introducaoatecnicasdediagnosticomolecular3-120325153120-phpapp02
 
Métodos de Investigação Epidemiológica
Métodos de Investigação Epidemiológica Métodos de Investigação Epidemiológica
Métodos de Investigação Epidemiológica
 
Estudo endoretal da próstata com realização de ecodoppler a cores indentifica...
Estudo endoretal da próstata com realização de ecodoppler a cores indentifica...Estudo endoretal da próstata com realização de ecodoppler a cores indentifica...
Estudo endoretal da próstata com realização de ecodoppler a cores indentifica...
 
ulsd729961_td_Pedro_Salgueiro.pdf
ulsd729961_td_Pedro_Salgueiro.pdfulsd729961_td_Pedro_Salgueiro.pdf
ulsd729961_td_Pedro_Salgueiro.pdf
 
Aula22 05
Aula22 05Aula22 05
Aula22 05
 
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoesSequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoes
 

Mais de Genomika Diagnósticos

API-Centric Data Integration for Human Genomics Reference Databases: Achieve...
 API-Centric Data Integration for Human Genomics Reference Databases: Achieve... API-Centric Data Integration for Human Genomics Reference Databases: Achieve...
API-Centric Data Integration for Human Genomics Reference Databases: Achieve...Genomika Diagnósticos
 
The importance of an adequate soft-clip based approach on bioinformatics pipe...
The importance of an adequate soft-clip based approach on bioinformatics pipe...The importance of an adequate soft-clip based approach on bioinformatics pipe...
The importance of an adequate soft-clip based approach on bioinformatics pipe...Genomika Diagnósticos
 
Best Practices for Bioinformatics Pipelines for Molecular-Barcoded Targeted S...
Best Practices for Bioinformatics Pipelines for Molecular-Barcoded Targeted S...Best Practices for Bioinformatics Pipelines for Molecular-Barcoded Targeted S...
Best Practices for Bioinformatics Pipelines for Molecular-Barcoded Targeted S...Genomika Diagnósticos
 
X-Meeting Poster 2015 - Vallys A Coverage tool
X-Meeting Poster 2015 - Vallys A Coverage toolX-Meeting Poster 2015 - Vallys A Coverage tool
X-Meeting Poster 2015 - Vallys A Coverage toolGenomika Diagnósticos
 
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...Genomika Diagnósticos
 
Construindo softwares de bioinformática para análises clínicas (Introdução)
Construindo softwares  de bioinformática  para análises clínicas (Introdução)  Construindo softwares  de bioinformática  para análises clínicas (Introdução)
Construindo softwares de bioinformática para análises clínicas (Introdução) Genomika Diagnósticos
 

Mais de Genomika Diagnósticos (9)

MamaRisk - Resume Article IHC 2016
MamaRisk - Resume Article IHC 2016MamaRisk - Resume Article IHC 2016
MamaRisk - Resume Article IHC 2016
 
MamaRisk - Presentation IHC 2016
MamaRisk - Presentation IHC 2016MamaRisk - Presentation IHC 2016
MamaRisk - Presentation IHC 2016
 
API-Centric Data Integration for Human Genomics Reference Databases: Achieve...
 API-Centric Data Integration for Human Genomics Reference Databases: Achieve... API-Centric Data Integration for Human Genomics Reference Databases: Achieve...
API-Centric Data Integration for Human Genomics Reference Databases: Achieve...
 
The importance of an adequate soft-clip based approach on bioinformatics pipe...
The importance of an adequate soft-clip based approach on bioinformatics pipe...The importance of an adequate soft-clip based approach on bioinformatics pipe...
The importance of an adequate soft-clip based approach on bioinformatics pipe...
 
Best Practices for Bioinformatics Pipelines for Molecular-Barcoded Targeted S...
Best Practices for Bioinformatics Pipelines for Molecular-Barcoded Targeted S...Best Practices for Bioinformatics Pipelines for Molecular-Barcoded Targeted S...
Best Practices for Bioinformatics Pipelines for Molecular-Barcoded Targeted S...
 
X-Meeting Poster 2015 - Vallys A Coverage tool
X-Meeting Poster 2015 - Vallys A Coverage toolX-Meeting Poster 2015 - Vallys A Coverage tool
X-Meeting Poster 2015 - Vallys A Coverage tool
 
Docker poster bsb2015-print
Docker poster bsb2015-printDocker poster bsb2015-print
Docker poster bsb2015-print
 
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
 
Construindo softwares de bioinformática para análises clínicas (Introdução)
Construindo softwares  de bioinformática  para análises clínicas (Introdução)  Construindo softwares  de bioinformática  para análises clínicas (Introdução)
Construindo softwares de bioinformática para análises clínicas (Introdução)
 

Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéis genéticos.

  • 1. George Carvalhoa , Wilder Galvãoa , Marcel Caracioloa , Rodrigo Alexandrea , Nara Diniza , Renata Moldenhauerb , João B Oliveiraa a Genomika Diagnósticos, Recife-PE; b Hospital Israelita Albert Einstein, São Paulo - SP Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéis genéticos INTRODUção e MOTIVAção O diagnóstico molecular de doenças genéticas é, atualmente, ferramenta indispensável para o seguimento clínico adequado dos pacientes e para o aconselhamento genético familiar. Variações no número de cópias (CNVs) são segmentos do DNA que foram deletados ou duplicados em tamanho maior que 50 pares de bases, podendo representar até 10% dos casos de câncer hereditário e 14% dos casos de doenças genéticas pediátricas [1, 2, 3]. Com o custo e a complexidade na análise dos dados gerados pelo sequenciamento de genoma completo (WGS), o sequenciamento de exoma (WES) e o de amplicons têm se tornado as principais metodologias com propósito diagnóstico usando sequenciamento de nova geração (NGS). Essas técnicas têm demonstrado alta capacidade na identificação de variantes de nucleotídeo únicos (SNVs) e pequenas inserções/deleções (INDELS) raras, porém a identificação de grandes deleções e duplicações são menos confidentes nessas técnicas quando comparadas a utilização do WGS, da hibridização genômica comparativa baseada em microarranjos (aCGH) e da amplificação de múltiplas sondas dependentes de ligação (MLPA) [4]. Para que painéis genéticos e o sequenciamento de exoma substituam essas outras metodologias é necessário um software ou a combinação de softwares que detectam CNVs por exons com alta sensibilidade, especificidade e uma taxa de falso-positivos aceitável. Com isso, iniciamos o desenvolvimento de pipelines para a detecção de CNVs em painéis e exomas possibilitando o aumento de casos clínicos elucidados. As amostras foram sequenciadas na Genomika Diagnósticos utilizando o kit Qiagen V3, que usa em seu protocolo barcodes moleculares. Esta etapa possibilita uma melhor acurácia na descoberta de SNVs e mantém uma homogeneidade na quantidade de leituras observadas. Através de um benchmark prévio entre o ExomeDepth e o CoNVaDING foi possível selecionar o primeiro software a ser utilizado em nossas rotinas. O ExomeDepth obteve 100% de acurácia, precisão, sensitividade e especificidade em nosso estudo prévio. Porém, com o uso em rotina foi possível perceber um aumento gradual na taxa de falso-positivos [5]. Todas as amostras utilizadas no benchmark anterior somadas as amostras confirmadas como falso-positivas por MLPA (n=29), foram reprocessadas após a introdução do software UMItools que permite extrair apenas os barcodes moleculares únicos para a análise de cobertura [6]. bioinfo@genomika.com.br | genomika.com.br Recife, PE / São Paulo, SP | Brazil MÉTODoS REFERÊNCIAS 1. Alkan, Can, Bradley P. Coe, and Evan E. Eichler. "Genome structural variation discovery and genotyping." Nature Reviews Genetics 12.5 (2011): 363. 2. Shlien, Adam, and David Malkin. "Copy number variations and cancer." Genome medicine 1.6 (2009): 62. 3. Cooper, Gregory M., et al. "A copy number variation morbidity map of developmental delay." Nature genetics 43.9 (2011): 838. 4. Ellingford, Jamie M., et al. "Validation of copy number variation analysis for next-generation sequencing diagnostics." European Journal of Human Genetics 25.6 (2017): 719 5. Carvalho, George; et al. “Improving variant accuracy with copy number variant pipeline for target sequencing” - https://bit.ly/2jRNKC5 6. Smith, Tom, Andreas Heger, and Ian Sudbery. "UMI-tools: modeling sequencing errors in Unique Molecular Identifiers to improve quantification accuracy." Genome research 27.3 (2017): 491-499. BENCHMARK Com a introdução do processo de extração de barcodes moleculares foi possível diminuir a taxa de falso-positivos para zero dentro do conjunto de amostras com confirmações de MLPA disponíveis no laboratório. Nossos resultados demonstram a importância da utilização de ferramentas para a detecção de CNVs na rotina clínica, limitando o uso de metodologias padrão-ouro como o MLPA apenas paras as amostras com variantes encontradas com pipeline de bioinformática para detecção de CNVs. Todavia, é necessário realizar mais validações com um número maior de amostras testadas antes de implementar totalmente essa metodologia. Adicionalmente, como indicado nas boas práticas para bioinformática clínica, pretendemos testar outras ferramentas para que se tenha mais de um software para detecção de CNVs com respaldo clínico. DISCUSSÃO E CONCLUSÃO Figura 1: Classes de CNVs possíveis de serem identificadas usando algoritmos de leitura de cobertura disponíveis para sequenciamento de amplicons. Figura 2: Processos internalizados para a identificação de CNVs usando painéis genéticos. Tabela 1: Benchmark entre antes e depois da implantação do UMItools. Foram usados cálculos estatísticos derivados da matriz de confusão. Contagem de verdadeiro-positivos (VP), verdadeiro-negativos (VN), falso-positivos (FP) e falso-negativos (FN) foi baseada na quantidade amostras com confirmações por MLPA (n=29). VPPipeline 12 VN 15 FP 2 FN 0 Acurácia 93,10% Precisão 85,71% Sensibilidade 100% Especificidade 88,23% 12 17 0 0 100% 100% 100% 100% UMIs duplicados Apenas UMIs únicos Cutadapt trimming de qualidade BWA-MEM mapeamento de sequências SamTools conversão de formatos Picard marcação de duplicatas UMI TOOLS BAM apenas com UMIs alinhados GATK realinhamento local de intervalos, realinhamento local entre INDELs, recalibração de pontuação de qualidade por base, chamada de SNPs Annovar Anotações de variantes ExomeDepth Detecção de CNVs cnvScan Anotação de CNVs Arquivo VCF SNVs e INDELs input fastq FASTQC (controle de qualidade) DELEÇÃO Ref. DUPLICAÇÃO EM TANDEM Ref. DUPLICAÇÃO INTERCALADA Ref. Interpretação e Confirmação