SlideShare uma empresa Scribd logo
1 de 32
Bioinformática com
Biopython
Marcos Castro
Python Brasil 11
Apresentação
• Nome: Marcos Castro
• Formação: Ciência da Computação.
• Obs.: espero não assassinar a Biologia...
• Grupo de Bioinformática Unifesp-SJC
• Apresentações toda sexta.
• O café do laboratório é famoso!
• Objetivos da palestra:
• Incentivar o uso de Python em Bioinformática.
• Uso de Biopython para otimizar o seu tempo.
2
Bioinformática
3
O que é Biopython?
• Conjuntos de ferramentas gratuitas para bioinformática.
• Site oficial: http://biopython.org/
• Código Biopython: https://github.com/biopython/biopython
• Biopython Tutorial: http://biopython.org/DIST/docs/tutorial/Tutorial.pdf
• Códigos da apresentação: https://github.com/marcoscastro/pybr11
• Slides: https://speakerdeck.com/marcoscastro/bioinformatica-com-biopython
4
Instalação
• Suporte para diversos sistemas operacionais:
• http://biopython.org/wiki/Download
• Versões:
• http://biopython.org/DIST/
• Pelo pip:
• pip install biopython
5
Hello Biopython
6
objeto Seq
Complementar e reverso complementar
• Complemento:
• Reverso complementar:
7
Transcrição
• Transcrição: onde tem “T” troca por “U” (recordando o ensino médio).
• IUPAC: define padrões de alfabetos para nucleotídeos/proteínas.
8
Tradução
• De RNA para proteína:
• Tradução direta (DNA para proteína):
9
Parsers – Bio.SeqIO
• O pacote BioSeqIO fornece suporte a vários formatos tais como fasta, fastq etc.
• FASTA
• Formato muito utilizado para armazenamento de sequências biológicas.
10
Parsers – Bio.SeqIO
• Lendo arquivo FASTA:
11
Parsers – Bio.SeqIO
• Gerando arquivo FASTA:
12
Parsers – Bio.SeqIO
• Lendo arquivo genbank:
13
Parsers – Bio.SeqIO
• Conversões FASTQ -> FASTA e FASTQ -> QUAL
14
Parsers – Bio.SeqIO
• Conversão genbank -> FASTA
15
Parsers – Bio.SeqIO
• Ordenando arquivos Multi-FASTA pelo tamanho:
16
Alinhamentos
• Módulo pairwise2: from Bio.pairwise2 import *
17
BLAST remoto
• BLAST: Basic Local Alignment Search Tool
• Vários ferramentas: blastn (nucleotídeos), blatsp (proteínas) etc.
18
BLAST local
• Requer que a suíte de aplicativos esteja instalada:
• ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST
19
Visualização de dados
• Necessita do módulo pylab (pip install matplotlib)
• Conteúdo GC (GC content):
20
Visualização de dados
• Conteúdo GC (GC content):
21
Visualização de dados
• Quantidade de genes pelo tamanho da sequência codificadora.
22
Visualização de dados
23
Cálculo do N50
24
Árvore Trie
• http://bioinformatics.cvr.ac.uk/blog/trie-data-structure/
25
Algoritmos Genéticos
• Exemplo:
26
Algoritmos Genéticos
• Exemplo:
• http://biopython.org/DIST/docs/api/Bio.GA-module.html
27
kNN (k-nearest-neighbors classification)
• Necessita do pacote numpy.
28
Aprendendo Bioinformática
• Introdução à Programação para Bioinformática com Biopython:
• http://www.amazon.com/dp/B015IK1C4O/
• Documentação Biopython:
• http://pydoc.net/Python/biopython/1.63
• Artigo Biopython:
• http://goo.gl/yYSyLs
• Rosalind:
• Aprenda Bioinformática resolvendo problemas.
• http://rosalind.info/
• Blog Bioinformática:
• http://bioinformatica.blog.br/
29
Aprendendo Bioinformática
• An Introduction to Bioinformatics Algorithms (Pavel Pevzner)
• Curso de Bioinformática com Python:
• https://goo.gl/kwiZf7
• Várias apresentações sobre temas relacionados à Bioinformática:
• https://speakerdeck.com/marcoscastro
• http://slideshare.net/mcastrosouza
30
Contato
mcastrosouza@live.com
https://twitter.com/mcastrosouza
http://bioinformatica.blog.br/
31
Dúvidas?
32

Mais conteúdo relacionado

Mais procurados

Estudo dirigido (metodologia da pesquisa científica) Thais Venuto
Estudo dirigido (metodologia da pesquisa científica) Thais VenutoEstudo dirigido (metodologia da pesquisa científica) Thais Venuto
Estudo dirigido (metodologia da pesquisa científica) Thais VenutoThais Sousa Venuto
 
Citoplasma - Biologia
Citoplasma - BiologiaCitoplasma - Biologia
Citoplasma - BiologiaCarson Souza
 
Genética probabilidade slides
Genética probabilidade slidesGenética probabilidade slides
Genética probabilidade slidesFabiano Reis
 
Aula 1 origem e evolução das células
Aula 1   origem e evolução das célulasAula 1   origem e evolução das células
Aula 1 origem e evolução das célulasEd_Fis_2015
 
Aula de Biologia Molecular sobre Síntese de Proteínas
Aula de Biologia Molecular sobre Síntese de ProteínasAula de Biologia Molecular sobre Síntese de Proteínas
Aula de Biologia Molecular sobre Síntese de ProteínasJaqueline Almeida
 
Genética bacteriana
Genética bacterianaGenética bacteriana
Genética bacterianakaiorochars
 
II. 3 Os ácidos nucléicos
II. 3 Os ácidos nucléicosII. 3 Os ácidos nucléicos
II. 3 Os ácidos nucléicosRebeca Vale
 
Heredogramas genetica
Heredogramas genetica Heredogramas genetica
Heredogramas genetica Raissa Araujo
 
Bioinformática arquivo de dados
Bioinformática arquivo de dadosBioinformática arquivo de dados
Bioinformática arquivo de dadosUERGS
 
Imuno-hematologia Básica
Imuno-hematologia BásicaImuno-hematologia Básica
Imuno-hematologia BásicaThiago Vianna
 
Meios de Contraste em Tomografia
Meios de Contraste em Tomografia Meios de Contraste em Tomografia
Meios de Contraste em Tomografia Rodrigo Ribeiro Jr.
 
Alteracoes cromossomicas
Alteracoes cromossomicasAlteracoes cromossomicas
Alteracoes cromossomicasURCA
 
Tomografia posicionamento
Tomografia posicionamentoTomografia posicionamento
Tomografia posicionamentoFLAVIO LOBATO
 

Mais procurados (20)

Estudo dirigido (metodologia da pesquisa científica) Thais Venuto
Estudo dirigido (metodologia da pesquisa científica) Thais VenutoEstudo dirigido (metodologia da pesquisa científica) Thais Venuto
Estudo dirigido (metodologia da pesquisa científica) Thais Venuto
 
Citoplasma - Biologia
Citoplasma - BiologiaCitoplasma - Biologia
Citoplasma - Biologia
 
Sistema abo e fator rh
Sistema abo e fator rhSistema abo e fator rh
Sistema abo e fator rh
 
Anatomia Aplicada da Coluna Cervical
Anatomia Aplicada da Coluna CervicalAnatomia Aplicada da Coluna Cervical
Anatomia Aplicada da Coluna Cervical
 
Genética probabilidade slides
Genética probabilidade slidesGenética probabilidade slides
Genética probabilidade slides
 
Aula 1 origem e evolução das células
Aula 1   origem e evolução das célulasAula 1   origem e evolução das células
Aula 1 origem e evolução das células
 
Biologia molecular
Biologia molecularBiologia molecular
Biologia molecular
 
Revisão Sistemática da Literatura
Revisão Sistemática da LiteraturaRevisão Sistemática da Literatura
Revisão Sistemática da Literatura
 
Noçoes de mamografia
Noçoes de mamografiaNoçoes de mamografia
Noçoes de mamografia
 
Aula de Biologia Molecular sobre Síntese de Proteínas
Aula de Biologia Molecular sobre Síntese de ProteínasAula de Biologia Molecular sobre Síntese de Proteínas
Aula de Biologia Molecular sobre Síntese de Proteínas
 
Genética bacteriana
Genética bacterianaGenética bacteriana
Genética bacteriana
 
II. 3 Os ácidos nucléicos
II. 3 Os ácidos nucléicosII. 3 Os ácidos nucléicos
II. 3 Os ácidos nucléicos
 
Heredogramas genetica
Heredogramas genetica Heredogramas genetica
Heredogramas genetica
 
01ppt fluidos biologicos
01ppt fluidos biologicos01ppt fluidos biologicos
01ppt fluidos biologicos
 
RESSONÂNCIA MAGNÉTICA-ATUALIZAÇÃO
RESSONÂNCIA MAGNÉTICA-ATUALIZAÇÃORESSONÂNCIA MAGNÉTICA-ATUALIZAÇÃO
RESSONÂNCIA MAGNÉTICA-ATUALIZAÇÃO
 
Bioinformática arquivo de dados
Bioinformática arquivo de dadosBioinformática arquivo de dados
Bioinformática arquivo de dados
 
Imuno-hematologia Básica
Imuno-hematologia BásicaImuno-hematologia Básica
Imuno-hematologia Básica
 
Meios de Contraste em Tomografia
Meios de Contraste em Tomografia Meios de Contraste em Tomografia
Meios de Contraste em Tomografia
 
Alteracoes cromossomicas
Alteracoes cromossomicasAlteracoes cromossomicas
Alteracoes cromossomicas
 
Tomografia posicionamento
Tomografia posicionamentoTomografia posicionamento
Tomografia posicionamento
 

Destaque

Ferramentas para Bioinformática
Ferramentas para BioinformáticaFerramentas para Bioinformática
Ferramentas para BioinformáticaMarcos Castro
 
Bioinformática com Rosalind utilizando Python
Bioinformática com Rosalind utilizando PythonBioinformática com Rosalind utilizando Python
Bioinformática com Rosalind utilizando PythonMarcos Castro
 
Agrupamento de sequências biológicas
Agrupamento de sequências biológicasAgrupamento de sequências biológicas
Agrupamento de sequências biológicasMarcos Castro
 
A importância da Bioinformática
A importância da BioinformáticaA importância da Bioinformática
A importância da BioinformáticaMarcos Castro
 
Colored de Bruijn Graphs
Colored de Bruijn GraphsColored de Bruijn Graphs
Colored de Bruijn GraphsMarcos Castro
 
Grafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBSGrafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBSMarcos Castro
 
Árvores de Decisão
Árvores de DecisãoÁrvores de Decisão
Árvores de DecisãoMarcos Castro
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraFlávia Salame
 

Destaque (11)

Ferramentas para Bioinformática
Ferramentas para BioinformáticaFerramentas para Bioinformática
Ferramentas para Bioinformática
 
Bioinformática com Rosalind utilizando Python
Bioinformática com Rosalind utilizando PythonBioinformática com Rosalind utilizando Python
Bioinformática com Rosalind utilizando Python
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
 
Agrupamento de sequências biológicas
Agrupamento de sequências biológicasAgrupamento de sequências biológicas
Agrupamento de sequências biológicas
 
A importância da Bioinformática
A importância da BioinformáticaA importância da Bioinformática
A importância da Bioinformática
 
Colored de Bruijn Graphs
Colored de Bruijn GraphsColored de Bruijn Graphs
Colored de Bruijn Graphs
 
Grafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBSGrafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBS
 
Árvores de Decisão
Árvores de DecisãoÁrvores de Decisão
Árvores de Decisão
 
Bio python
Bio pythonBio python
Bio python
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma Amostra
 

Semelhante a Bioinformática com Biopython

BeavOps : Como o Python ajudou a integrar o mundo DevOps
BeavOps : Como o Python ajudou a integrar o mundo DevOpsBeavOps : Como o Python ajudou a integrar o mundo DevOps
BeavOps : Como o Python ajudou a integrar o mundo DevOps4LinuxCursos
 
Poco Bibliotecas C++
Poco Bibliotecas C++Poco Bibliotecas C++
Poco Bibliotecas C++Uilian Ries
 
Apresentação sobre a COSINF
Apresentação sobre a COSINFApresentação sobre a COSINF
Apresentação sobre a COSINFAllyson Barros
 
Colaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHPColaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHPThiago Colares
 
20220707_AtoM_in_VINCULUM_RicardoPinho
20220707_AtoM_in_VINCULUM_RicardoPinho20220707_AtoM_in_VINCULUM_RicardoPinho
20220707_AtoM_in_VINCULUM_RicardoPinhoRicardo Pinho
 
Colaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHPColaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHPCBA2012
 
Cake php selecaodeprojetos-apres-em-modelo
Cake php selecaodeprojetos-apres-em-modeloCake php selecaodeprojetos-apres-em-modelo
Cake php selecaodeprojetos-apres-em-modeloCBA2012
 
O que podemos fazer com Python?
O que podemos fazer com Python?O que podemos fazer com Python?
O que podemos fazer com Python?Izabela Guerreiro
 
Micropython - Python para microcontroladores
Micropython - Python para microcontroladoresMicropython - Python para microcontroladores
Micropython - Python para microcontroladoresFabio Souza
 
Python com baterias incluídas v2.0
Python com baterias incluídas v2.0Python com baterias incluídas v2.0
Python com baterias incluídas v2.0Jonh Edson
 
[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes
[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes
[GUTS-RS] GUTS Talks - Ferramentas de Automação de TestesGUTS-RS
 
Tutorial Django + Python
Tutorial Django + PythonTutorial Django + Python
Tutorial Django + PythonMateus Padua
 
Open vpn
Open vpnOpen vpn
Open vpnTiago
 
Roslyn analyzers: File->New->Project
Roslyn analyzers: File->New->ProjectRoslyn analyzers: File->New->Project
Roslyn analyzers: File->New->ProjectPaulo Morgado
 

Semelhante a Bioinformática com Biopython (20)

Canivete python
Canivete pythonCanivete python
Canivete python
 
Palestra sobre Bioinformática
Palestra sobre BioinformáticaPalestra sobre Bioinformática
Palestra sobre Bioinformática
 
BeavOps : Como o Python ajudou a integrar o mundo DevOps
BeavOps : Como o Python ajudou a integrar o mundo DevOpsBeavOps : Como o Python ajudou a integrar o mundo DevOps
BeavOps : Como o Python ajudou a integrar o mundo DevOps
 
Hello, Python!
Hello, Python!Hello, Python!
Hello, Python!
 
Poco Bibliotecas C++
Poco Bibliotecas C++Poco Bibliotecas C++
Poco Bibliotecas C++
 
Apresentação sobre a COSINF
Apresentação sobre a COSINFApresentação sobre a COSINF
Apresentação sobre a COSINF
 
Bt4 H2HC6th
Bt4 H2HC6thBt4 H2HC6th
Bt4 H2HC6th
 
ACC-Bioinformatica-Seminario
ACC-Bioinformatica-SeminarioACC-Bioinformatica-Seminario
ACC-Bioinformatica-Seminario
 
Colaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHPColaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHP
 
20220707_AtoM_in_VINCULUM_RicardoPinho
20220707_AtoM_in_VINCULUM_RicardoPinho20220707_AtoM_in_VINCULUM_RicardoPinho
20220707_AtoM_in_VINCULUM_RicardoPinho
 
Colaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHPColaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHP
 
Cake php selecaodeprojetos-apres-em-modelo
Cake php selecaodeprojetos-apres-em-modeloCake php selecaodeprojetos-apres-em-modelo
Cake php selecaodeprojetos-apres-em-modelo
 
Python e suas aplicações
Python e suas aplicaçõesPython e suas aplicações
Python e suas aplicações
 
O que podemos fazer com Python?
O que podemos fazer com Python?O que podemos fazer com Python?
O que podemos fazer com Python?
 
Micropython - Python para microcontroladores
Micropython - Python para microcontroladoresMicropython - Python para microcontroladores
Micropython - Python para microcontroladores
 
Python com baterias incluídas v2.0
Python com baterias incluídas v2.0Python com baterias incluídas v2.0
Python com baterias incluídas v2.0
 
[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes
[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes
[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes
 
Tutorial Django + Python
Tutorial Django + PythonTutorial Django + Python
Tutorial Django + Python
 
Open vpn
Open vpnOpen vpn
Open vpn
 
Roslyn analyzers: File->New->Project
Roslyn analyzers: File->New->ProjectRoslyn analyzers: File->New->Project
Roslyn analyzers: File->New->Project
 

Mais de Marcos Castro

Maratona de Programação
Maratona de ProgramaçãoMaratona de Programação
Maratona de ProgramaçãoMarcos Castro
 
Redes Neurais Artificiais
Redes Neurais ArtificiaisRedes Neurais Artificiais
Redes Neurais ArtificiaisMarcos Castro
 
Problema do Caixeiro Viajante
Problema do Caixeiro ViajanteProblema do Caixeiro Viajante
Problema do Caixeiro ViajanteMarcos Castro
 
Metaheurística Simulated Annealing
Metaheurística Simulated AnnealingMetaheurística Simulated Annealing
Metaheurística Simulated AnnealingMarcos Castro
 
Expressões Regulares com Python 3
Expressões Regulares com Python 3Expressões Regulares com Python 3
Expressões Regulares com Python 3Marcos Castro
 
Programação dinâmica
Programação dinâmicaProgramação dinâmica
Programação dinâmicaMarcos Castro
 
Busca em largura - BFS
Busca em largura - BFSBusca em largura - BFS
Busca em largura - BFSMarcos Castro
 
Análise Assintótica
Análise AssintóticaAnálise Assintótica
Análise AssintóticaMarcos Castro
 
Listas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionáriosListas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionáriosMarcos Castro
 
Python - Dicionários
Python - DicionáriosPython - Dicionários
Python - DicionáriosMarcos Castro
 
Backtracking - Gerar todos os subconjuntos
Backtracking - Gerar todos os subconjuntosBacktracking - Gerar todos os subconjuntos
Backtracking - Gerar todos os subconjuntosMarcos Castro
 
Longest palindromic subsequence (LPS)
Longest palindromic subsequence (LPS)Longest palindromic subsequence (LPS)
Longest palindromic subsequence (LPS)Marcos Castro
 
Problema da Mochila 0-1 (Knapsack problem)
Problema da Mochila 0-1 (Knapsack problem)Problema da Mochila 0-1 (Knapsack problem)
Problema da Mochila 0-1 (Knapsack problem)Marcos Castro
 
Algoritmo de Knuth-Morris-Pratt - KMP
Algoritmo de Knuth-Morris-Pratt - KMPAlgoritmo de Knuth-Morris-Pratt - KMP
Algoritmo de Knuth-Morris-Pratt - KMPMarcos Castro
 

Mais de Marcos Castro (20)

Maratona de Programação
Maratona de ProgramaçãoMaratona de Programação
Maratona de Programação
 
Arquivos FASTQ
Arquivos FASTQArquivos FASTQ
Arquivos FASTQ
 
Redes Neurais Artificiais
Redes Neurais ArtificiaisRedes Neurais Artificiais
Redes Neurais Artificiais
 
Problema do Caixeiro Viajante
Problema do Caixeiro ViajanteProblema do Caixeiro Viajante
Problema do Caixeiro Viajante
 
Metaheurística Simulated Annealing
Metaheurística Simulated AnnealingMetaheurística Simulated Annealing
Metaheurística Simulated Annealing
 
Expressões Regulares com Python 3
Expressões Regulares com Python 3Expressões Regulares com Python 3
Expressões Regulares com Python 3
 
Algoritmos gulosos
Algoritmos gulososAlgoritmos gulosos
Algoritmos gulosos
 
Programação dinâmica
Programação dinâmicaProgramação dinâmica
Programação dinâmica
 
Busca em largura - BFS
Busca em largura - BFSBusca em largura - BFS
Busca em largura - BFS
 
Análise Assintótica
Análise AssintóticaAnálise Assintótica
Análise Assintótica
 
Listas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionáriosListas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionários
 
Python - Set
Python - SetPython - Set
Python - Set
 
Python - Dicionários
Python - DicionáriosPython - Dicionários
Python - Dicionários
 
Tabela Hash
Tabela HashTabela Hash
Tabela Hash
 
Binary heap
Binary heapBinary heap
Binary heap
 
Fila de prioridades
Fila de prioridadesFila de prioridades
Fila de prioridades
 
Backtracking - Gerar todos os subconjuntos
Backtracking - Gerar todos os subconjuntosBacktracking - Gerar todos os subconjuntos
Backtracking - Gerar todos os subconjuntos
 
Longest palindromic subsequence (LPS)
Longest palindromic subsequence (LPS)Longest palindromic subsequence (LPS)
Longest palindromic subsequence (LPS)
 
Problema da Mochila 0-1 (Knapsack problem)
Problema da Mochila 0-1 (Knapsack problem)Problema da Mochila 0-1 (Knapsack problem)
Problema da Mochila 0-1 (Knapsack problem)
 
Algoritmo de Knuth-Morris-Pratt - KMP
Algoritmo de Knuth-Morris-Pratt - KMPAlgoritmo de Knuth-Morris-Pratt - KMP
Algoritmo de Knuth-Morris-Pratt - KMP
 

Bioinformática com Biopython