2. O que é Bioinformática?
Definição
2
"Bioinformática é um campo interdisciplinar que corresponde a
aplicação das técnicas da informática, no sentido de análise da
informação na área de estudo da biologia."
Wikipedia:
https://pt.wikipedia.org/wiki/Bioinform%C3%A1tica
3. 1994 / 1996
Poder 1999
1990-2001
em 2015 (10 dias)
Agora 2016
Começo oficial do Projeto Genoma
Humano
Rotina NGS em
Clinicas de Diagnóstico
maior parte dos genoma esta
mapeado / "Bermuda
Principles”.
Sequenciamento de DNA em
larga-escala
$1 bilhão
$ 10 mil
1990
FUTURE 2026
Projeto Genoma Humano
anos dourados da bioinformática
http://www.yourgenome.org/facts/
timeline-the-human-genome-project
6. www.yourwebsitename.com
Tamanho em Giga Bases (Gb)
Giga Bases (G bases)
6
Painel, depende do
número de genes
ou regiões
Whole
Exome
Sequence
Whole Genome
Sequence
?
32Mb
20Gb
Escala em Giga Bases
7. Tipos de Dados
Next Generation Sequences (NGS)
7
FASTQ BAM VCF BED
FASTA + Quality
arquivo texto com
sequências de
nucleotídeos e
qualidade por base.
Binary Alignment Map
arquivo binário de
sequências alinhadas
em uma referência.
Variant Allele
Frequency
arquivo texto com as
variantes encontradas
em relação a
referência.
Browser Extensible
Data
arquivo texto com
regiões genéticas alvos
de interesse
17. Genome Analysis Toolkit GATK
Variant Discovery in High-Throughput Sequencing Data
17
https://software.broadinstitute.org/gatk/
18. Genome Analysis Toolkit GATK
Variant Discovery in High-Throughput Sequencing Data
18
https://software.broadinstitute.org/gatk/
19. Chamada de Variantes
Mutação em ponto β-globin
19
Illustration showing the point mutation in the β-globin gene responsible for the genetic blood disorder β-thalassaemia.
Image credit: Genome Research Limited.
20. Chamada de Variantes (exome)
Target sequence (exome)
20
https://software.broadinstitute.org/gatk/events/slides/1503/GATKwh6-BP-0A-Intro_to_HTS.pdf
23. Ultra-deep sequencing
Optimizing Cancer Genome Sequencing and Analysis
23
(B) Model of clonal architecture and tumor evolution, inferred from the original 30x sequencing data.
(C) Ultra-deep sequencing and validation, revealing additional subclonal complexity.
http://www.cell.com/cell-systems/abstract/S2405-4712(15)00113-1
24.
25. Banco de Dados Públicos
Dados de Referência
25
ExAC65k
ClinVar
26. Banco de Dados Públicos
Dados de Referência
26
• 1000 Genomes Project (2015 Agosto)
• Allele frequency data in 1000 Genomes Project (AFR (African), AMR (Admixed American), EAS
(East Asian), EUR (European), SAS (South Asian))
• http://www.1000genomes.org/
• dbSNP
• Minor Allele Frequency (MAF)
• http://www.ncbi.nlm.nih.gov/SNP/
• O ESP é um projecto financiado pelo NHLBI exome
• 6500 amostras
• http://evs.gs.washington.edu/EVS/
27. Banco de Dados Públicos (ClinVar)
Dados de Referência
27
• CLINVAR: variantes com associação clínica:
• unknown
• untested
• non-pathogenic
• probable-non-pathogenic
• probable-pathogenic
• pathogenic
• drug-response
• histocompatibility
• other e com nome das doenças
28. Banco de Dados Públicos (COSMIC)
Dados de Referência
28
• COSMIC: Catalogue of Somatic Mutations in Cancer
• http://cancer.sanger.ac.uk/cosmic
29. Banco de Dados Públicos (ExAC)
Dados de Referência
29
• ExAC 65000 Exome Allele Frequency
• AFR (African)
• AMR (Admixed American)
• EAS (East Asian)
• FIN (Finnish)
• NFE (Non-finnish European)
• OTH (other)
• SAS (South Asian)
http://exac.broadinstitute.org/