SlideShare uma empresa Scribd logo
1 de 36
Baixar para ler offline
Bioinformática
Introdução
Renato Puga
Hospital Israelita Albert Einstein - Pesquisa Clínica
renato.puga@einstein.br
O que é Bioinformática?
Definição
2
"Bioinformática é um campo interdisciplinar que corresponde a
aplicação das técnicas da informática, no sentido de análise da
informação na área de estudo da biologia."
Wikipedia:
https://pt.wikipedia.org/wiki/Bioinform%C3%A1tica
1994 / 1996
Poder 1999
1990-2001
em 2015 (10 dias)
Agora 2016
Começo oficial do Projeto Genoma
Humano
Rotina NGS em
Clinicas de Diagnóstico
maior parte dos genoma esta
mapeado / "Bermuda
Principles”.
Sequenciamento de DNA em
larga-escala
$1 bilhão
$ 10 mil
1990
FUTURE 2026
Projeto Genoma Humano
anos dourados da bioinformática
http://www.yourgenome.org/facts/
timeline-the-human-genome-project
4
Sequenciamento
Next Generation Sequencing
Tamanho do Sequenciamento
WGS / WES / Panel
5
Whole Genome
Sequence
(WGS)
Whole Exome
Sequence
(WES)
Panel
1% do
WGS
www.yourwebsitename.com
Tamanho em Giga Bases (Gb)
Giga Bases (G bases)
6
Painel, depende do
número de genes
ou regiões
Whole
Exome
Sequence
Whole Genome
Sequence
?
32Mb
20Gb
Escala em Giga Bases
Tipos de Dados
Next Generation Sequences (NGS)
7
FASTQ BAM VCF BED
FASTA + Quality
arquivo texto com
sequências de
nucleotídeos e
qualidade por base.
Binary Alignment Map
arquivo binário de
sequências alinhadas
em uma referência.
Variant Allele
Frequency
arquivo texto com as
variantes encontradas
em relação a
referência.
Browser Extensible
Data
arquivo texto com
regiões genéticas alvos
de interesse
Tipos de Dados: FASTQ
Next Generation Sequences (NGS)
8
Tipos de Dados: Phred Score
Next Generation Sequences (NGS)
9
http://www.illumina.com/documents/products/technotes/technote_Q-Scores.pdf
Tipos de Dados: Phred Score
Next Generation Sequences (NGS)
10
Phred
Score
Pares de bases (pb)
Tipos de Dados: Binary Alignment Map (BAM)
Next Generation Sequences (NGS)
11
https://software.broadinstitute.org/gatk/events/slides/1503/GATKwh6-BP-0A-Intro_to_HTS.pdf
Tipos de Dados: FASTQ (in) BAM (out)
Next Generation Sequences (NGS)
12
https://software.broadinstitute.org/gatk/events/slides/1503/GATKwh6-BP-0A-Intro_to_HTS.pdf
FASTQ
(dados brutos)
BAM
(alinhados)
Referência
(genoma)
Tipos de Dados: Variant Call Format (VCF)
Next Generation Sequences (NGS)
13
Tipos de Dados: Browser Extensible Data (BED)
Next Generation Sequences (NGS)
14
chr11 5246919 5246920 Hb_North_York 2619 Hemoglobin variant
chr11 5255660 5255661 HBD c.1 G>A 2659 delta0 thalassemia
chr11 5247945 5247946 Hb Sheffield 2672 Hemoglobin variant
chr11 5255415 5255416 Hb A2-Lyon 2676 Hemoglobin variant
chr11 5248234 5248235 Hb Aix-les-Bains 2677 Hemoglobin variant
https://genome.ucsc.edu/FAQ/FAQformat.html#format1.7
Chr Start End
Tempo de Sequenciamento
NextSeq 500
15
FASTQ BAM VCF
2-3d 2-3h 1h
3-4d 3-5h 2h
7-10d 8-12h 5h
Painel (150X)
WES (50X)
WGS (30x)
Ferramentas de
Bioinformática
webtools & apps
Genome Analysis Toolkit GATK
Variant Discovery in High-Throughput Sequencing Data
17
https://software.broadinstitute.org/gatk/
Genome Analysis Toolkit GATK
Variant Discovery in High-Throughput Sequencing Data
18
https://software.broadinstitute.org/gatk/
Chamada de Variantes
Mutação em ponto β-globin
19
Illustration showing the point mutation in the β-globin gene responsible for the genetic blood disorder β-thalassaemia.
Image credit: Genome Research Limited.
Chamada de Variantes (exome)
Target sequence (exome)
20
https://software.broadinstitute.org/gatk/events/slides/1503/GATKwh6-BP-0A-Intro_to_HTS.pdf
Cobertura
Regiões cobertas por reads
21
http://www.rapidnovor.com/wp-content/uploads/2016/03/coverage-torn.png
www.yourwebsitename.com
Variant Allele Frequency (VCF)
22
http://compbio.cs.brown.edu/projects/btp/simple.jpg
Ultra-deep sequencing
Optimizing Cancer Genome Sequencing and Analysis
23
(B) Model of clonal architecture and tumor evolution, inferred from the original 30x sequencing data.
(C) Ultra-deep sequencing and validation, revealing additional subclonal complexity.

http://www.cell.com/cell-systems/abstract/S2405-4712(15)00113-1
Banco de Dados Públicos
Dados de Referência
25
ExAC65k
ClinVar
Banco de Dados Públicos
Dados de Referência
26
• 1000 Genomes Project (2015 Agosto)
• Allele frequency data in 1000 Genomes Project (AFR (African), AMR (Admixed American), EAS
(East Asian), EUR (European), SAS (South Asian))
• http://www.1000genomes.org/
• dbSNP
• Minor Allele Frequency (MAF)
• http://www.ncbi.nlm.nih.gov/SNP/
• O ESP é um projecto financiado pelo NHLBI exome
• 6500 amostras
• http://evs.gs.washington.edu/EVS/
Banco de Dados Públicos (ClinVar)
Dados de Referência
27
• CLINVAR: variantes com associação clínica:
• unknown
• untested
• non-pathogenic
• probable-non-pathogenic
• probable-pathogenic
• pathogenic
• drug-response
• histocompatibility
• other e com nome das doenças
Banco de Dados Públicos (COSMIC)
Dados de Referência
28
• COSMIC: Catalogue of Somatic Mutations in Cancer
• http://cancer.sanger.ac.uk/cosmic
Banco de Dados Públicos (ExAC)
Dados de Referência
29
• ExAC 65000 Exome Allele Frequency
• AFR (African)
• AMR (Admixed American)
• EAS (East Asian)
• FIN (Finnish)
• NFE (Non-finnish European)
• OTH (other)
• SAS (South Asian)
http://exac.broadinstitute.org/
Caso de uso
nomenclatura de variantes
www.yourwebsitename.com31
Apps & New Services
>2016
Obrigado

Mais conteúdo relacionado

Mais procurados

Sequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoesSequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoesRinaldo Pereira
 
Novas Perspectivas em Estudos de Ecologia Microbiana
Novas Perspectivas em Estudos de Ecologia MicrobianaNovas Perspectivas em Estudos de Ecologia Microbiana
Novas Perspectivas em Estudos de Ecologia MicrobianaLeandro Lemos
 
Engenharia Genetica
Engenharia GeneticaEngenharia Genetica
Engenharia GeneticaAlunos IFMA
 
Bioinformática aplicada nas análises da microbiota do rúmen
Bioinformática aplicada nas análises da microbiota do rúmenBioinformática aplicada nas análises da microbiota do rúmen
Bioinformática aplicada nas análises da microbiota do rúmenLeandro Lemos
 
A explosão da pesquisa genômica - Guilherme Oliveira
A explosão da pesquisa genômica - Guilherme OliveiraA explosão da pesquisa genômica - Guilherme Oliveira
A explosão da pesquisa genômica - Guilherme OliveiraGenômica Fiocruz
 
Fundamentos de Engenharia Genética
Fundamentos de Engenharia GenéticaFundamentos de Engenharia Genética
Fundamentos de Engenharia GenéticaPedro Veiga
 
Projeto Genoma Humano
Projeto Genoma Humano Projeto Genoma Humano
Projeto Genoma Humano Carol Olimpio
 
Comparação de metodologias para detecção de variações cromossômicas e de sequ...
Comparação de metodologias para detecção de variações cromossômicas e de sequ...Comparação de metodologias para detecção de variações cromossômicas e de sequ...
Comparação de metodologias para detecção de variações cromossômicas e de sequ...Rinaldo Pereira
 
Engenharia Genética - Biologia
Engenharia Genética - BiologiaEngenharia Genética - Biologia
Engenharia Genética - BiologiaTiago Faisca
 
IV WSF, Vilhena - Rogério Martins Gonçalves - Identificação e Diversidade Gen...
IV WSF, Vilhena - Rogério Martins Gonçalves - Identificação e Diversidade Gen...IV WSF, Vilhena - Rogério Martins Gonçalves - Identificação e Diversidade Gen...
IV WSF, Vilhena - Rogério Martins Gonçalves - Identificação e Diversidade Gen...Oxya Agro e Biociências
 
Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)Bio
 
Análises de metagenomas
Análises de metagenomasAnálises de metagenomas
Análises de metagenomasLeandro Lemos
 

Mais procurados (20)

RNAseq Analysis
RNAseq AnalysisRNAseq Analysis
RNAseq Analysis
 
Personalomics
PersonalomicsPersonalomics
Personalomics
 
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoesSequenciamento de ultima geracao na identificacao de inversoes e translocacoes
Sequenciamento de ultima geracao na identificacao de inversoes e translocacoes
 
Novas Perspectivas em Estudos de Ecologia Microbiana
Novas Perspectivas em Estudos de Ecologia MicrobianaNovas Perspectivas em Estudos de Ecologia Microbiana
Novas Perspectivas em Estudos de Ecologia Microbiana
 
Meta'omics
Meta'omicsMeta'omics
Meta'omics
 
Engenharia Genetica
Engenharia GeneticaEngenharia Genetica
Engenharia Genetica
 
Bioinformática aplicada nas análises da microbiota do rúmen
Bioinformática aplicada nas análises da microbiota do rúmenBioinformática aplicada nas análises da microbiota do rúmen
Bioinformática aplicada nas análises da microbiota do rúmen
 
Engenharia genética
Engenharia genéticaEngenharia genética
Engenharia genética
 
A explosão da pesquisa genômica - Guilherme Oliveira
A explosão da pesquisa genômica - Guilherme OliveiraA explosão da pesquisa genômica - Guilherme Oliveira
A explosão da pesquisa genômica - Guilherme Oliveira
 
Fundamentos de Engenharia Genética
Fundamentos de Engenharia GenéticaFundamentos de Engenharia Genética
Fundamentos de Engenharia Genética
 
Projeto Genoma Humano
Projeto Genoma Humano Projeto Genoma Humano
Projeto Genoma Humano
 
ENGENHARIA GENÉTICA
ENGENHARIA GENÉTICAENGENHARIA GENÉTICA
ENGENHARIA GENÉTICA
 
Engenharia Genética
Engenharia GenéticaEngenharia Genética
Engenharia Genética
 
Comparação de metodologias para detecção de variações cromossômicas e de sequ...
Comparação de metodologias para detecção de variações cromossômicas e de sequ...Comparação de metodologias para detecção de variações cromossômicas e de sequ...
Comparação de metodologias para detecção de variações cromossômicas e de sequ...
 
Engenharia genética
Engenharia genéticaEngenharia genética
Engenharia genética
 
Engenharia Genética - Biologia
Engenharia Genética - BiologiaEngenharia Genética - Biologia
Engenharia Genética - Biologia
 
IV WSF, Vilhena - Rogério Martins Gonçalves - Identificação e Diversidade Gen...
IV WSF, Vilhena - Rogério Martins Gonçalves - Identificação e Diversidade Gen...IV WSF, Vilhena - Rogério Martins Gonçalves - Identificação e Diversidade Gen...
IV WSF, Vilhena - Rogério Martins Gonçalves - Identificação e Diversidade Gen...
 
Engenharia genética
Engenharia genéticaEngenharia genética
Engenharia genética
 
Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)
 
Análises de metagenomas
Análises de metagenomasAnálises de metagenomas
Análises de metagenomas
 

Destaque

Case studies of HTS / NGS applications
Case studies of HTS / NGS applicationsCase studies of HTS / NGS applications
Case studies of HTS / NGS applicationsrjorton
 
Errors and Limitaions of Next Generation Sequencing
Errors and Limitaions of Next Generation SequencingErrors and Limitaions of Next Generation Sequencing
Errors and Limitaions of Next Generation SequencingNixon Mendez
 
Speeding up sequencing: Sequencing in an hour enables sample to answer in a w...
Speeding up sequencing: Sequencing in an hour enables sample to answer in a w...Speeding up sequencing: Sequencing in an hour enables sample to answer in a w...
Speeding up sequencing: Sequencing in an hour enables sample to answer in a w...Thermo Fisher Scientific
 
transforming clinical microbiology by next generation sequencing
transforming clinical microbiology by next generation sequencingtransforming clinical microbiology by next generation sequencing
transforming clinical microbiology by next generation sequencingPathKind Labs
 
NGS overview
NGS overviewNGS overview
NGS overviewAllSeq
 
QIAseq Technologies for Metagenomics and Microbiome NGS Library Prep
QIAseq Technologies for Metagenomics and Microbiome NGS Library PrepQIAseq Technologies for Metagenomics and Microbiome NGS Library Prep
QIAseq Technologies for Metagenomics and Microbiome NGS Library PrepQIAGEN
 
NGx Sequencing 101-platforms
NGx Sequencing 101-platformsNGx Sequencing 101-platforms
NGx Sequencing 101-platformsAllSeq
 
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...nist-spin
 
Building bioinformatics resources for the global community
Building bioinformatics resources for the global communityBuilding bioinformatics resources for the global community
Building bioinformatics resources for the global communityExternalEvents
 
Aug2013 Heidi Rehm integrating large scale sequencing into clinical practice
Aug2013 Heidi Rehm integrating large scale sequencing into clinical practiceAug2013 Heidi Rehm integrating large scale sequencing into clinical practice
Aug2013 Heidi Rehm integrating large scale sequencing into clinical practiceGenomeInABottle
 
Tools for Metagenomics with 16S/ITS and Whole Genome Shotgun Sequences
Tools for Metagenomics with 16S/ITS and Whole Genome Shotgun SequencesTools for Metagenomics with 16S/ITS and Whole Genome Shotgun Sequences
Tools for Metagenomics with 16S/ITS and Whole Genome Shotgun SequencesSurya Saha
 
Plant genome sequencing and crop improvement
Plant genome sequencing and crop improvementPlant genome sequencing and crop improvement
Plant genome sequencing and crop improvementRagavendran Abbai
 

Destaque (20)

Case studies of HTS / NGS applications
Case studies of HTS / NGS applicationsCase studies of HTS / NGS applications
Case studies of HTS / NGS applications
 
Errors and Limitaions of Next Generation Sequencing
Errors and Limitaions of Next Generation SequencingErrors and Limitaions of Next Generation Sequencing
Errors and Limitaions of Next Generation Sequencing
 
Rossen eccmid2015v1.5
Rossen eccmid2015v1.5Rossen eccmid2015v1.5
Rossen eccmid2015v1.5
 
Speeding up sequencing: Sequencing in an hour enables sample to answer in a w...
Speeding up sequencing: Sequencing in an hour enables sample to answer in a w...Speeding up sequencing: Sequencing in an hour enables sample to answer in a w...
Speeding up sequencing: Sequencing in an hour enables sample to answer in a w...
 
transforming clinical microbiology by next generation sequencing
transforming clinical microbiology by next generation sequencingtransforming clinical microbiology by next generation sequencing
transforming clinical microbiology by next generation sequencing
 
Ngs presentation
Ngs presentationNgs presentation
Ngs presentation
 
NGS overview
NGS overviewNGS overview
NGS overview
 
Ngs intro_v6_public
 Ngs intro_v6_public Ngs intro_v6_public
Ngs intro_v6_public
 
QIAseq Technologies for Metagenomics and Microbiome NGS Library Prep
QIAseq Technologies for Metagenomics and Microbiome NGS Library PrepQIAseq Technologies for Metagenomics and Microbiome NGS Library Prep
QIAseq Technologies for Metagenomics and Microbiome NGS Library Prep
 
NGx Sequencing 101-platforms
NGx Sequencing 101-platformsNGx Sequencing 101-platforms
NGx Sequencing 101-platforms
 
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
 
Introduction to Metagenomics Data Analysis - UEB-VHIR - 2013
Introduction to Metagenomics Data Analysis - UEB-VHIR - 2013Introduction to Metagenomics Data Analysis - UEB-VHIR - 2013
Introduction to Metagenomics Data Analysis - UEB-VHIR - 2013
 
Metagenomics
MetagenomicsMetagenomics
Metagenomics
 
Introduction to next generation sequencing
Introduction to next generation sequencingIntroduction to next generation sequencing
Introduction to next generation sequencing
 
NGS: Mapping and de novo assembly
NGS: Mapping and de novo assemblyNGS: Mapping and de novo assembly
NGS: Mapping and de novo assembly
 
Building bioinformatics resources for the global community
Building bioinformatics resources for the global communityBuilding bioinformatics resources for the global community
Building bioinformatics resources for the global community
 
Aug2013 Heidi Rehm integrating large scale sequencing into clinical practice
Aug2013 Heidi Rehm integrating large scale sequencing into clinical practiceAug2013 Heidi Rehm integrating large scale sequencing into clinical practice
Aug2013 Heidi Rehm integrating large scale sequencing into clinical practice
 
EU PathoNGenTraceConsortium:cgMLST Evolvement and Challenges for Harmonization
EU PathoNGenTraceConsortium:cgMLST Evolvement and Challenges for HarmonizationEU PathoNGenTraceConsortium:cgMLST Evolvement and Challenges for Harmonization
EU PathoNGenTraceConsortium:cgMLST Evolvement and Challenges for Harmonization
 
Tools for Metagenomics with 16S/ITS and Whole Genome Shotgun Sequences
Tools for Metagenomics with 16S/ITS and Whole Genome Shotgun SequencesTools for Metagenomics with 16S/ITS and Whole Genome Shotgun Sequences
Tools for Metagenomics with 16S/ITS and Whole Genome Shotgun Sequences
 
Plant genome sequencing and crop improvement
Plant genome sequencing and crop improvementPlant genome sequencing and crop improvement
Plant genome sequencing and crop improvement
 

Semelhante a Bioinfo 40

BAG2019 - São Paulo - Turma 2
BAG2019 - São Paulo - Turma 2BAG2019 - São Paulo - Turma 2
BAG2019 - São Paulo - Turma 2Renato Puga
 
ERBASE 2019 - Renato Puga
ERBASE 2019 - Renato PugaERBASE 2019 - Renato Puga
ERBASE 2019 - Renato PugaRenato Puga
 
Laboratório Nacional de Computação Científica
Laboratório Nacional de Computação CientíficaLaboratório Nacional de Computação Científica
Laboratório Nacional de Computação CientíficaNIT Rio
 
Centro Brasileiro de Pesquisas Físicas
Centro Brasileiro de Pesquisas FísicasCentro Brasileiro de Pesquisas Físicas
Centro Brasileiro de Pesquisas FísicasNIT Rio
 
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...Genomika Diagnósticos
 
Avanços e perspectivas em Bioinformática
Avanços e perspectivas em BioinformáticaAvanços e perspectivas em Bioinformática
Avanços e perspectivas em BioinformáticaLeandro Lima
 
Anotação molecular
Anotação molecularAnotação molecular
Anotação molecularUERGS
 
Python na Informática para Biodiversidade
Python na Informática para BiodiversidadePython na Informática para Biodiversidade
Python na Informática para BiodiversidadeMauro Cavalcanti
 
Python Na Informática Para Biodiversidade
Python Na Informática Para BiodiversidadePython Na Informática Para Biodiversidade
Python Na Informática Para Biodiversidadegsroma
 
SEMANA 05 - BIOLOGIA - 3ª SÉRIE - BIOTECNOLOGIA
SEMANA 05 - BIOLOGIA - 3ª SÉRIE - BIOTECNOLOGIASEMANA 05 - BIOLOGIA - 3ª SÉRIE - BIOTECNOLOGIA
SEMANA 05 - BIOLOGIA - 3ª SÉRIE - BIOTECNOLOGIAGernciadeProduodeMat
 
TDC2016SP - Trilha Embarcados
TDC2016SP - Trilha EmbarcadosTDC2016SP - Trilha Embarcados
TDC2016SP - Trilha Embarcadostdc-globalcode
 
Monografia final Sistema Controle de Estoque
Monografia final Sistema Controle de EstoqueMonografia final Sistema Controle de Estoque
Monografia final Sistema Controle de EstoqueInacioBelo
 
Ulisses mello: IBM
Ulisses mello: IBMUlisses mello: IBM
Ulisses mello: IBMStrider
 
O BNDES e o apoio à inovação - Casos de sucesso
O BNDES e o apoio à inovação - Casos de sucessoO BNDES e o apoio à inovação - Casos de sucesso
O BNDES e o apoio à inovação - Casos de sucessoBNDES
 
Radiologia Digital-Infraestrutura e Fluxo de Trabalho (1).pptx
Radiologia Digital-Infraestrutura e Fluxo de Trabalho (1).pptxRadiologia Digital-Infraestrutura e Fluxo de Trabalho (1).pptx
Radiologia Digital-Infraestrutura e Fluxo de Trabalho (1).pptxFRANCISCODENISTEIXEI
 
Análises de sequências metagenômicas via MG-RAST
Análises de sequências metagenômicas via MG-RASTAnálises de sequências metagenômicas via MG-RAST
Análises de sequências metagenômicas via MG-RASTLeandro Lemos
 
O BNDES e o apoio à inovação
O BNDES e o apoio à inovaçãoO BNDES e o apoio à inovação
O BNDES e o apoio à inovaçãoBNDES
 

Semelhante a Bioinfo 40 (18)

BAG2019 - São Paulo - Turma 2
BAG2019 - São Paulo - Turma 2BAG2019 - São Paulo - Turma 2
BAG2019 - São Paulo - Turma 2
 
ERBASE 2019 - Renato Puga
ERBASE 2019 - Renato PugaERBASE 2019 - Renato Puga
ERBASE 2019 - Renato Puga
 
Laboratório Nacional de Computação Científica
Laboratório Nacional de Computação CientíficaLaboratório Nacional de Computação Científica
Laboratório Nacional de Computação Científica
 
Centro Brasileiro de Pesquisas Físicas
Centro Brasileiro de Pesquisas FísicasCentro Brasileiro de Pesquisas Físicas
Centro Brasileiro de Pesquisas Físicas
 
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
 
Avanços e perspectivas em Bioinformática
Avanços e perspectivas em BioinformáticaAvanços e perspectivas em Bioinformática
Avanços e perspectivas em Bioinformática
 
Anotação molecular
Anotação molecularAnotação molecular
Anotação molecular
 
Python na Informática para Biodiversidade
Python na Informática para BiodiversidadePython na Informática para Biodiversidade
Python na Informática para Biodiversidade
 
Python Na Informática Para Biodiversidade
Python Na Informática Para BiodiversidadePython Na Informática Para Biodiversidade
Python Na Informática Para Biodiversidade
 
SEMANA 05 - BIOLOGIA - 3ª SÉRIE - BIOTECNOLOGIA
SEMANA 05 - BIOLOGIA - 3ª SÉRIE - BIOTECNOLOGIASEMANA 05 - BIOLOGIA - 3ª SÉRIE - BIOTECNOLOGIA
SEMANA 05 - BIOLOGIA - 3ª SÉRIE - BIOTECNOLOGIA
 
Inauguracao NCC
Inauguracao NCCInauguracao NCC
Inauguracao NCC
 
TDC2016SP - Trilha Embarcados
TDC2016SP - Trilha EmbarcadosTDC2016SP - Trilha Embarcados
TDC2016SP - Trilha Embarcados
 
Monografia final Sistema Controle de Estoque
Monografia final Sistema Controle de EstoqueMonografia final Sistema Controle de Estoque
Monografia final Sistema Controle de Estoque
 
Ulisses mello: IBM
Ulisses mello: IBMUlisses mello: IBM
Ulisses mello: IBM
 
O BNDES e o apoio à inovação - Casos de sucesso
O BNDES e o apoio à inovação - Casos de sucessoO BNDES e o apoio à inovação - Casos de sucesso
O BNDES e o apoio à inovação - Casos de sucesso
 
Radiologia Digital-Infraestrutura e Fluxo de Trabalho (1).pptx
Radiologia Digital-Infraestrutura e Fluxo de Trabalho (1).pptxRadiologia Digital-Infraestrutura e Fluxo de Trabalho (1).pptx
Radiologia Digital-Infraestrutura e Fluxo de Trabalho (1).pptx
 
Análises de sequências metagenômicas via MG-RAST
Análises de sequências metagenômicas via MG-RASTAnálises de sequências metagenômicas via MG-RAST
Análises de sequências metagenômicas via MG-RAST
 
O BNDES e o apoio à inovação
O BNDES e o apoio à inovaçãoO BNDES e o apoio à inovação
O BNDES e o apoio à inovação
 

Bioinfo 40

  • 1. Bioinformática Introdução Renato Puga Hospital Israelita Albert Einstein - Pesquisa Clínica renato.puga@einstein.br
  • 2. O que é Bioinformática? Definição 2 "Bioinformática é um campo interdisciplinar que corresponde a aplicação das técnicas da informática, no sentido de análise da informação na área de estudo da biologia." Wikipedia: https://pt.wikipedia.org/wiki/Bioinform%C3%A1tica
  • 3. 1994 / 1996 Poder 1999 1990-2001 em 2015 (10 dias) Agora 2016 Começo oficial do Projeto Genoma Humano Rotina NGS em Clinicas de Diagnóstico maior parte dos genoma esta mapeado / "Bermuda Principles”. Sequenciamento de DNA em larga-escala $1 bilhão $ 10 mil 1990 FUTURE 2026 Projeto Genoma Humano anos dourados da bioinformática http://www.yourgenome.org/facts/ timeline-the-human-genome-project
  • 5. Tamanho do Sequenciamento WGS / WES / Panel 5 Whole Genome Sequence (WGS) Whole Exome Sequence (WES) Panel 1% do WGS
  • 6. www.yourwebsitename.com Tamanho em Giga Bases (Gb) Giga Bases (G bases) 6 Painel, depende do número de genes ou regiões Whole Exome Sequence Whole Genome Sequence ? 32Mb 20Gb Escala em Giga Bases
  • 7. Tipos de Dados Next Generation Sequences (NGS) 7 FASTQ BAM VCF BED FASTA + Quality arquivo texto com sequências de nucleotídeos e qualidade por base. Binary Alignment Map arquivo binário de sequências alinhadas em uma referência. Variant Allele Frequency arquivo texto com as variantes encontradas em relação a referência. Browser Extensible Data arquivo texto com regiões genéticas alvos de interesse
  • 8. Tipos de Dados: FASTQ Next Generation Sequences (NGS) 8
  • 9. Tipos de Dados: Phred Score Next Generation Sequences (NGS) 9 http://www.illumina.com/documents/products/technotes/technote_Q-Scores.pdf
  • 10. Tipos de Dados: Phred Score Next Generation Sequences (NGS) 10 Phred Score Pares de bases (pb)
  • 11. Tipos de Dados: Binary Alignment Map (BAM) Next Generation Sequences (NGS) 11 https://software.broadinstitute.org/gatk/events/slides/1503/GATKwh6-BP-0A-Intro_to_HTS.pdf
  • 12. Tipos de Dados: FASTQ (in) BAM (out) Next Generation Sequences (NGS) 12 https://software.broadinstitute.org/gatk/events/slides/1503/GATKwh6-BP-0A-Intro_to_HTS.pdf FASTQ (dados brutos) BAM (alinhados) Referência (genoma)
  • 13. Tipos de Dados: Variant Call Format (VCF) Next Generation Sequences (NGS) 13
  • 14. Tipos de Dados: Browser Extensible Data (BED) Next Generation Sequences (NGS) 14 chr11 5246919 5246920 Hb_North_York 2619 Hemoglobin variant chr11 5255660 5255661 HBD c.1 G>A 2659 delta0 thalassemia chr11 5247945 5247946 Hb Sheffield 2672 Hemoglobin variant chr11 5255415 5255416 Hb A2-Lyon 2676 Hemoglobin variant chr11 5248234 5248235 Hb Aix-les-Bains 2677 Hemoglobin variant https://genome.ucsc.edu/FAQ/FAQformat.html#format1.7 Chr Start End
  • 15. Tempo de Sequenciamento NextSeq 500 15 FASTQ BAM VCF 2-3d 2-3h 1h 3-4d 3-5h 2h 7-10d 8-12h 5h Painel (150X) WES (50X) WGS (30x)
  • 17. Genome Analysis Toolkit GATK Variant Discovery in High-Throughput Sequencing Data 17 https://software.broadinstitute.org/gatk/
  • 18. Genome Analysis Toolkit GATK Variant Discovery in High-Throughput Sequencing Data 18 https://software.broadinstitute.org/gatk/
  • 19. Chamada de Variantes Mutação em ponto β-globin 19 Illustration showing the point mutation in the β-globin gene responsible for the genetic blood disorder β-thalassaemia. Image credit: Genome Research Limited.
  • 20. Chamada de Variantes (exome) Target sequence (exome) 20 https://software.broadinstitute.org/gatk/events/slides/1503/GATKwh6-BP-0A-Intro_to_HTS.pdf
  • 21. Cobertura Regiões cobertas por reads 21 http://www.rapidnovor.com/wp-content/uploads/2016/03/coverage-torn.png
  • 22. www.yourwebsitename.com Variant Allele Frequency (VCF) 22 http://compbio.cs.brown.edu/projects/btp/simple.jpg
  • 23. Ultra-deep sequencing Optimizing Cancer Genome Sequencing and Analysis 23 (B) Model of clonal architecture and tumor evolution, inferred from the original 30x sequencing data. (C) Ultra-deep sequencing and validation, revealing additional subclonal complexity.
 http://www.cell.com/cell-systems/abstract/S2405-4712(15)00113-1
  • 24.
  • 25. Banco de Dados Públicos Dados de Referência 25 ExAC65k ClinVar
  • 26. Banco de Dados Públicos Dados de Referência 26 • 1000 Genomes Project (2015 Agosto) • Allele frequency data in 1000 Genomes Project (AFR (African), AMR (Admixed American), EAS (East Asian), EUR (European), SAS (South Asian)) • http://www.1000genomes.org/ • dbSNP • Minor Allele Frequency (MAF) • http://www.ncbi.nlm.nih.gov/SNP/ • O ESP é um projecto financiado pelo NHLBI exome • 6500 amostras • http://evs.gs.washington.edu/EVS/
  • 27. Banco de Dados Públicos (ClinVar) Dados de Referência 27 • CLINVAR: variantes com associação clínica: • unknown • untested • non-pathogenic • probable-non-pathogenic • probable-pathogenic • pathogenic • drug-response • histocompatibility • other e com nome das doenças
  • 28. Banco de Dados Públicos (COSMIC) Dados de Referência 28 • COSMIC: Catalogue of Somatic Mutations in Cancer • http://cancer.sanger.ac.uk/cosmic
  • 29. Banco de Dados Públicos (ExAC) Dados de Referência 29 • ExAC 65000 Exome Allele Frequency • AFR (African) • AMR (Admixed American) • EAS (East Asian) • FIN (Finnish) • NFE (Non-finnish European) • OTH (other) • SAS (South Asian) http://exac.broadinstitute.org/
  • 30. Caso de uso nomenclatura de variantes
  • 32. Apps & New Services >2016
  • 33.
  • 34.
  • 35.