SlideShare uma empresa Scribd logo
1 de 32
Bioinformática com
Biopython
Marcos Castro
Python Brasil 11
Apresentação
• Nome: Marcos Castro
• Formação: Ciência da Computação.
• Obs.: espero não assassinar a Biologia...
• Grupo de Bioinformática Unifesp-SJC
• Apresentações toda sexta.
• O café do laboratório é famoso!
• Objetivos da palestra:
• Incentivar o uso de Python em Bioinformática.
• Uso de Biopython para otimizar o seu tempo.
2
Bioinformática
3
O que é Biopython?
• Conjuntos de ferramentas gratuitas para bioinformática.
• Site oficial: http://biopython.org/
• Código Biopython: https://github.com/biopython/biopython
• Biopython Tutorial: http://biopython.org/DIST/docs/tutorial/Tutorial.pdf
• Códigos da apresentação: https://github.com/marcoscastro/pybr11
• Slides: https://speakerdeck.com/marcoscastro/bioinformatica-com-biopython
4
Instalação
• Suporte para diversos sistemas operacionais:
• http://biopython.org/wiki/Download
• Versões:
• http://biopython.org/DIST/
• Pelo pip:
• pip install biopython
5
Hello Biopython
6
objeto Seq
Complementar e reverso complementar
• Complemento:
• Reverso complementar:
7
Transcrição
• Transcrição: onde tem “T” troca por “U” (recordando o ensino médio).
• IUPAC: define padrões de alfabetos para nucleotídeos/proteínas.
8
Tradução
• De RNA para proteína:
• Tradução direta (DNA para proteína):
9
Parsers – Bio.SeqIO
• O pacote BioSeqIO fornece suporte a vários formatos tais como fasta, fastq etc.
• FASTA
• Formato muito utilizado para armazenamento de sequências biológicas.
10
Parsers – Bio.SeqIO
• Lendo arquivo FASTA:
11
Parsers – Bio.SeqIO
• Gerando arquivo FASTA:
12
Parsers – Bio.SeqIO
• Lendo arquivo genbank:
13
Parsers – Bio.SeqIO
• Conversões FASTQ -> FASTA e FASTQ -> QUAL
14
Parsers – Bio.SeqIO
• Conversão genbank -> FASTA
15
Parsers – Bio.SeqIO
• Ordenando arquivos Multi-FASTA pelo tamanho:
16
Alinhamentos
• Módulo pairwise2: from Bio.pairwise2 import *
17
BLAST remoto
• BLAST: Basic Local Alignment Search Tool
• Vários ferramentas: blastn (nucleotídeos), blatsp (proteínas) etc.
18
BLAST local
• Requer que a suíte de aplicativos esteja instalada:
• ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST
19
Visualização de dados
• Necessita do módulo pylab (pip install matplotlib)
• Conteúdo GC (GC content):
20
Visualização de dados
• Conteúdo GC (GC content):
21
Visualização de dados
• Quantidade de genes pelo tamanho da sequência codificadora.
22
Visualização de dados
23
Cálculo do N50
24
Árvore Trie
• http://bioinformatics.cvr.ac.uk/blog/trie-data-structure/
25
Algoritmos Genéticos
• Exemplo:
26
Algoritmos Genéticos
• Exemplo:
• http://biopython.org/DIST/docs/api/Bio.GA-module.html
27
kNN (k-nearest-neighbors classification)
• Necessita do pacote numpy.
28
Aprendendo Bioinformática
• Introdução à Programação para Bioinformática com Biopython:
• http://www.amazon.com/dp/B015IK1C4O/
• Documentação Biopython:
• http://pydoc.net/Python/biopython/1.63
• Artigo Biopython:
• http://goo.gl/yYSyLs
• Rosalind:
• Aprenda Bioinformática resolvendo problemas.
• http://rosalind.info/
• Blog Bioinformática:
• http://bioinformatica.blog.br/
29
Aprendendo Bioinformática
• An Introduction to Bioinformatics Algorithms (Pavel Pevzner)
• Curso de Bioinformática com Python:
• https://goo.gl/kwiZf7
• Várias apresentações sobre temas relacionados à Bioinformática:
• https://speakerdeck.com/marcoscastro
• http://slideshare.net/mcastrosouza
30
Contato
mcastrosouza@live.com
https://twitter.com/mcastrosouza
http://bioinformatica.blog.br/
31
Dúvidas?
32

Mais conteúdo relacionado

Mais procurados

Genetica de populações
Genetica de populaçõesGenetica de populações
Genetica de populações
UERGS
 
Genetica
GeneticaGenetica
Genetica
emanuel
 
Núcleo, cromatina, cromossomos, cariótipo, dna [salvo automaticamente] blog
Núcleo, cromatina, cromossomos, cariótipo, dna [salvo automaticamente] blogNúcleo, cromatina, cromossomos, cariótipo, dna [salvo automaticamente] blog
Núcleo, cromatina, cromossomos, cariótipo, dna [salvo automaticamente] blog
Regina de Castro
 
Classificação dos Seres Vivos
Classificação dos Seres VivosClassificação dos Seres Vivos
Classificação dos Seres Vivos
Juliana Mendes
 
Aula Classificação dos Seres Vivos
Aula Classificação dos Seres VivosAula Classificação dos Seres Vivos
Aula Classificação dos Seres Vivos
Plínio Gonçalves
 

Mais procurados (20)

Natureza do material genético
Natureza do material genético Natureza do material genético
Natureza do material genético
 
Slides da aula de Biologia (Marcelo) sobre Genética
Slides da aula de Biologia (Marcelo) sobre GenéticaSlides da aula de Biologia (Marcelo) sobre Genética
Slides da aula de Biologia (Marcelo) sobre Genética
 
Sistemática e classificação biológica 2 ano Ced 416
Sistemática e classificação biológica 2 ano Ced 416Sistemática e classificação biológica 2 ano Ced 416
Sistemática e classificação biológica 2 ano Ced 416
 
Genetica de populações
Genetica de populaçõesGenetica de populações
Genetica de populações
 
Cordados
CordadosCordados
Cordados
 
Genetica
GeneticaGenetica
Genetica
 
1EM #2 Evolução
1EM #2 Evolução1EM #2 Evolução
1EM #2 Evolução
 
V.2 Briófitas e Pteridófitas
V.2 Briófitas e PteridófitasV.2 Briófitas e Pteridófitas
V.2 Briófitas e Pteridófitas
 
teoria evolucionista Darwin e Lamarck
teoria evolucionista Darwin e Lamarckteoria evolucionista Darwin e Lamarck
teoria evolucionista Darwin e Lamarck
 
Núcleo, cromatina, cromossomos, cariótipo, dna [salvo automaticamente] blog
Núcleo, cromatina, cromossomos, cariótipo, dna [salvo automaticamente] blogNúcleo, cromatina, cromossomos, cariótipo, dna [salvo automaticamente] blog
Núcleo, cromatina, cromossomos, cariótipo, dna [salvo automaticamente] blog
 
Classificação dos Seres Vivos
Classificação dos Seres VivosClassificação dos Seres Vivos
Classificação dos Seres Vivos
 
Reino Monera (Arqueas e Bactérias)
Reino Monera (Arqueas e Bactérias)Reino Monera (Arqueas e Bactérias)
Reino Monera (Arqueas e Bactérias)
 
Nomenclatura taxonomia
Nomenclatura taxonomiaNomenclatura taxonomia
Nomenclatura taxonomia
 
Biologia (lamarckismo e darwinismo)
Biologia  (lamarckismo e darwinismo)Biologia  (lamarckismo e darwinismo)
Biologia (lamarckismo e darwinismo)
 
Bacterias
BacteriasBacterias
Bacterias
 
Aula Classificação dos Seres Vivos
Aula Classificação dos Seres VivosAula Classificação dos Seres Vivos
Aula Classificação dos Seres Vivos
 
Teorias da evolução
Teorias da evoluçãoTeorias da evolução
Teorias da evolução
 
Jeanderson plano de aula organização bioquímica da célula
Jeanderson plano de aula organização bioquímica da célulaJeanderson plano de aula organização bioquímica da célula
Jeanderson plano de aula organização bioquímica da célula
 
Genética probabilidade slides
Genética probabilidade slidesGenética probabilidade slides
Genética probabilidade slides
 
Teorias de evolução
Teorias de evoluçãoTeorias de evolução
Teorias de evolução
 

Destaque

Destaque (11)

Ferramentas para Bioinformática
Ferramentas para BioinformáticaFerramentas para Bioinformática
Ferramentas para Bioinformática
 
Bioinformática com Rosalind utilizando Python
Bioinformática com Rosalind utilizando PythonBioinformática com Rosalind utilizando Python
Bioinformática com Rosalind utilizando Python
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
 
Agrupamento de sequências biológicas
Agrupamento de sequências biológicasAgrupamento de sequências biológicas
Agrupamento de sequências biológicas
 
A importância da Bioinformática
A importância da BioinformáticaA importância da Bioinformática
A importância da Bioinformática
 
Colored de Bruijn Graphs
Colored de Bruijn GraphsColored de Bruijn Graphs
Colored de Bruijn Graphs
 
Grafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBSGrafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBS
 
Árvores de Decisão
Árvores de DecisãoÁrvores de Decisão
Árvores de Decisão
 
Bio python
Bio pythonBio python
Bio python
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma Amostra
 

Semelhante a Bioinformática com Biopython

Colaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHPColaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHP
CBA2012
 
Cake php selecaodeprojetos-apres-em-modelo
Cake php selecaodeprojetos-apres-em-modeloCake php selecaodeprojetos-apres-em-modelo
Cake php selecaodeprojetos-apres-em-modelo
CBA2012
 
Python com baterias incluídas v2.0
Python com baterias incluídas v2.0Python com baterias incluídas v2.0
Python com baterias incluídas v2.0
Jonh Edson
 
Tutorial Django + Python
Tutorial Django + PythonTutorial Django + Python
Tutorial Django + Python
Mateus Padua
 

Semelhante a Bioinformática com Biopython (20)

Canivete python
Canivete pythonCanivete python
Canivete python
 
Palestra sobre Bioinformática
Palestra sobre BioinformáticaPalestra sobre Bioinformática
Palestra sobre Bioinformática
 
BeavOps : Como o Python ajudou a integrar o mundo DevOps
BeavOps : Como o Python ajudou a integrar o mundo DevOpsBeavOps : Como o Python ajudou a integrar o mundo DevOps
BeavOps : Como o Python ajudou a integrar o mundo DevOps
 
Hello, Python!
Hello, Python!Hello, Python!
Hello, Python!
 
Poco Bibliotecas C++
Poco Bibliotecas C++Poco Bibliotecas C++
Poco Bibliotecas C++
 
Apresentação sobre a COSINF
Apresentação sobre a COSINFApresentação sobre a COSINF
Apresentação sobre a COSINF
 
Bt4 H2HC6th
Bt4 H2HC6thBt4 H2HC6th
Bt4 H2HC6th
 
ACC-Bioinformatica-Seminario
ACC-Bioinformatica-SeminarioACC-Bioinformatica-Seminario
ACC-Bioinformatica-Seminario
 
Colaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHPColaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHP
 
20220707_AtoM_in_VINCULUM_RicardoPinho
20220707_AtoM_in_VINCULUM_RicardoPinho20220707_AtoM_in_VINCULUM_RicardoPinho
20220707_AtoM_in_VINCULUM_RicardoPinho
 
Colaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHPColaboração em Projetos FLOSS: CakePHP
Colaboração em Projetos FLOSS: CakePHP
 
Cake php selecaodeprojetos-apres-em-modelo
Cake php selecaodeprojetos-apres-em-modeloCake php selecaodeprojetos-apres-em-modelo
Cake php selecaodeprojetos-apres-em-modelo
 
Python e suas aplicações
Python e suas aplicaçõesPython e suas aplicações
Python e suas aplicações
 
O que podemos fazer com Python?
O que podemos fazer com Python?O que podemos fazer com Python?
O que podemos fazer com Python?
 
Micropython - Python para microcontroladores
Micropython - Python para microcontroladoresMicropython - Python para microcontroladores
Micropython - Python para microcontroladores
 
Python com baterias incluídas v2.0
Python com baterias incluídas v2.0Python com baterias incluídas v2.0
Python com baterias incluídas v2.0
 
[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes
[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes
[GUTS-RS] GUTS Talks - Ferramentas de Automação de Testes
 
Tutorial Django + Python
Tutorial Django + PythonTutorial Django + Python
Tutorial Django + Python
 
Open vpn
Open vpnOpen vpn
Open vpn
 
Roslyn analyzers: File->New->Project
Roslyn analyzers: File->New->ProjectRoslyn analyzers: File->New->Project
Roslyn analyzers: File->New->Project
 

Mais de Marcos Castro

Mais de Marcos Castro (20)

Maratona de Programação
Maratona de ProgramaçãoMaratona de Programação
Maratona de Programação
 
Arquivos FASTQ
Arquivos FASTQArquivos FASTQ
Arquivos FASTQ
 
Redes Neurais Artificiais
Redes Neurais ArtificiaisRedes Neurais Artificiais
Redes Neurais Artificiais
 
Problema do Caixeiro Viajante
Problema do Caixeiro ViajanteProblema do Caixeiro Viajante
Problema do Caixeiro Viajante
 
Metaheurística Simulated Annealing
Metaheurística Simulated AnnealingMetaheurística Simulated Annealing
Metaheurística Simulated Annealing
 
Expressões Regulares com Python 3
Expressões Regulares com Python 3Expressões Regulares com Python 3
Expressões Regulares com Python 3
 
Algoritmos gulosos
Algoritmos gulososAlgoritmos gulosos
Algoritmos gulosos
 
Programação dinâmica
Programação dinâmicaProgramação dinâmica
Programação dinâmica
 
Busca em largura - BFS
Busca em largura - BFSBusca em largura - BFS
Busca em largura - BFS
 
Análise Assintótica
Análise AssintóticaAnálise Assintótica
Análise Assintótica
 
Listas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionáriosListas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionários
 
Python - Set
Python - SetPython - Set
Python - Set
 
Python - Dicionários
Python - DicionáriosPython - Dicionários
Python - Dicionários
 
Tabela Hash
Tabela HashTabela Hash
Tabela Hash
 
Binary heap
Binary heapBinary heap
Binary heap
 
Fila de prioridades
Fila de prioridadesFila de prioridades
Fila de prioridades
 
Backtracking - Gerar todos os subconjuntos
Backtracking - Gerar todos os subconjuntosBacktracking - Gerar todos os subconjuntos
Backtracking - Gerar todos os subconjuntos
 
Longest palindromic subsequence (LPS)
Longest palindromic subsequence (LPS)Longest palindromic subsequence (LPS)
Longest palindromic subsequence (LPS)
 
Problema da Mochila 0-1 (Knapsack problem)
Problema da Mochila 0-1 (Knapsack problem)Problema da Mochila 0-1 (Knapsack problem)
Problema da Mochila 0-1 (Knapsack problem)
 
Algoritmo de Knuth-Morris-Pratt - KMP
Algoritmo de Knuth-Morris-Pratt - KMPAlgoritmo de Knuth-Morris-Pratt - KMP
Algoritmo de Knuth-Morris-Pratt - KMP
 

Bioinformática com Biopython