SlideShare uma empresa Scribd logo
1 de 11
Baixar para ler offline
Universidade Federal do Rio Grande do Norte
Centro de Biociências
Departamento de Biofísica e Farmacologia

Disciplina de Bioinformática

Apostila de Introdução a Bioinformática

Prof. Alexandre Queiroz
Fevereiro de 2002
função das proteínas e as interações entre as

1. Biologia e Bioinformática

proteínas em um organismo resultando em energia,
metabolismo, reprodução e forma.

A bioinformática é um campo das ciências
biológicas que está em rápido crescimento e está

Os genes são as unidades hereditárias dos

sendo desenvolvida para atender à necessidade de

seres vivos. Sendo assim, a fidelidade das cópias

manipular-se com grandes quantidades de dados

das informações moleculares contidas nos genes é

genéticos e bioquímicos. Estes dados, originados a

crucial para a viabilidade dos organismos. Contudo,

partir do esforço individual de vários pesquisadores,

níveis residuais de mutações são igualmente

estão relacionados entre si através de uma origem

necessários para sua evolução e enriquecimento

comum: as células dos organismos vivos. Para

dos conjuntos de genes em populações. A partir da

compreender a relação entre estas informações

manipulação genética é possível expressar as

fragmentadas oriundas das diversas áreas da

informações contidas nas seqüências de bases de

Biologia (tais como Biologia molecular, bioquímica

um ou mais genes e daí se comparar às

estrutural,

molecular,

propriedades esperadas com aquelas apresentadas

fisiologia e patologia), a bioinformática usa o poder

pelas proteínas em relação à forma e função. A

computacional

e

tecnologia do DNA recombinante pode então ser

estruturar estas informações em uma entidade

utilizada para sintetizar grandes quantidades de

compreensiva e extremamente importante para a

proteínas para posterior análise bioquímica e assim

Biologia.

se confirmar às formas e funções previstas a partir

enzimologia,
para

Estas

Biologia

catalogar,

entidades

são

organizar

reflexões

da

organização celular da vida e seu denominador

das seqüências

nos

genes.

A

clonagem,

o

comum que é a evolução dos seres vivos a partir de

sequenciamento e a localização cromossômica são

uma forma ancestral comum.

3 aspectos bastante inter-relacionados necessários

Devido o fato da bioinformática ser ainda

para a compreensão da Biologia molecular de um

uma ciência recente ainda não se fez outra

gene e seu produto, a proteína. A Biologia

definição diferente ou mais precisa. Geralmente ela

molecular proporciona a base para a investigação

é referida como tendo a tarefa de organizar e

do genótipo através da Bioinformática.

analisar dados incrivelmente complexos resultantes

Durante os primeiros anos do século 20, os

de modernas técnicas de Biologia molecular e

bioquímicos utilizaram a química orgânica para

bioquímica. Para muitos a

bioinformática é uma

descobrir e montar vias metabólicas, estudar a

importante ferramenta para a compreensão de

cinética das enzimas e determinar as relações entre

como as informações contidas nos genes são

estas vias e as doenças hereditárias. Vale ressaltar

refletidas em características fisiológicas, como

que tudo isto foi realizado sem nenhuma técnica de

inteligência,

ou

Biologia molecular, sem nenhuma informação sobre

susceptibilidade ao câncer. De uma forma geral, a

a estrutura das proteínas e em muitos casos sequer

bioinformática é apresentada como sendo a ciência

se sabia que eram os ácidos nucléicos as unidades

da criação e manutenção de base de dados (ou

hereditárias da vida e não as proteínas. Da mesma

Bancos de Dados) e eventualmente a simulação de

forma que a química foi útil para os bioquímicos no

fenômenos dos organismos vivos. A Bioinformática

passado, e a Biologia molecular esta sendo hoje

se

em

baseia

crescimento

na

premissa

dos

de

cabelos

que

existe

um

dia,

a

bioinformática,

através

dos

relacionamento hierárquico entre as estruturas dos

conhecimentos gerados a partir das bases de

genes, seu arranjo em relação ao genoma, a

dados e das simulações também será bastante útil
para os biocientistas no futuro.

2
homólogos. Por exemplo, na tentativa de curar

2. A Internet e a Publicação científica

doenças humanas, muitos genes envolvidos com
Não só apenas as mudanças nas técnicas

várias vias metabólicas importantes para estas

bioquímicas influenciaram na produtividade e no

doenças foram estudados em leveduras. Esta

sucesso da bioquímica mas, sobretudo, a interação

abordagem se fundamenta na relação existente

entre os cientistas que através de esforços

entre todos os seres vivos baseado na evolução.

coletivos ou cooperativos buscaram realmente

Assim surge uma nova abordagem da Biologia, a

superar o esmagador e ao mesmo tempo tentador

genômica comparativa entre espécies lineares.
O lançamento do Projeto Genoma Humano

trabalho que havia pela frente. Tradicionalmente a
o

no final dos anos 80 (e muitos projetos genomas de

sequenciamento de genes era conduzido por

outros organismos) foi um evento decisivo para o

cientistas em trabalhos individuais usando uma

desenvolvimento da bioinformática. Os biologistas

abordagem clone após clone.

moleculares que participam do projeto genoma não

descoberta

de

vias

metabólicas

ou

conseguem ir

A ampla divulgação das novas descobertas

muito

longe

na

pesquisa

em

e desenvolvimento de novas técnicas envolvem o

seqüências

livre acesso a informações que estão sob forte

técnicas.

pressão do poder econômico. Para que o fluxo

produzem bits de milhares de pedaços pequenos

destas informações seja rápido, a Internet aparece

das seqüências de DNA que serão posteriormente

como uma ferramenta vital para os cientistas,

montados como um gigantesco quebra-cabeças,

porque

o

dando origem a seqüência genômica completa. A

de

bioinformática é a ferramenta analítica que eles

dados

precisam para ajudá-los a montar a seqüência

ela

permite

compartilhamento
informações

de

contidas

a

proliferação

grande
em

e

quantidade

bancos

de

lineares inteiras devido a limitações
Sendo

assim,

centralizados. O fluxo de informações científicas

genômica

e

através

biológica

relacionada

da

Internet

proporciona

3

grandes

finalmente

eles

simplesmente

revelar
a

esta

a

informação

seqüência.

A

vantagens para os cientistas: primeira, proporciona

informação genômica obtida é bastante relevante ,

o acesso à informação para qualquer um que

porque a função de um gene não está apenas na

possua um computador conectado a Internet e um

seqüência de codificação para uma proteína, mas

browser (navegador), sendo esta uma excelente

também

forma de democratização da informação. Em

genomas. Os organismos não usam os genes de

segundo lugar, as informações armazenadas em

forma isolada, mas sim em grupos. A compreensão

bancos

apresentam

de como o padrão de atividade destes genes é

redundância em vários graus. Isto ocorre devido ao

controlado durante o ciclo de vida de um organismo

fato de que vários pesquisadores podem contribuir

ainda está longe de ser totalmente compreendida

com a mesma informação para o banco de dados.

pelos biologistas. Cada uma das células de um

Por conseguinte o acesso a estas informações pela

organismo pluricelular contém um pacote completo

Internet proporciona um amplo e eficiente controle

de genes, mas apenas uma pequena parte é

de qualidade para as seqüências armazenadas. Em

utilizada pela célula (a maioria dos genes que

terceiro lugar, as informações armazenadas nos

nunca serão utilizados é inativada). A combinação

bancos de dados a respeito de um determinado

de genes ativados numa célula define seu destino

organismo fornecem valiosas informações que

biológico. Isto é conhecido como diferenciação

poderão ajudar os cientistas a descobrirem e

celular e, normalmente é um processo irreversível

compreenderem várias vias metabólicas de outros

durante a vida de uma célula. A genômica funcional

organismos através da comparação de genes

é

de

dados

centralizados

3

uma

na

organização

conseqüência

destes

direta

da

genes

nos

informação
acumulada

nas

seqüências

da

analisadas por gel de eletroforese bidimensional

organização destas dentro do genoma. Através da

(proteômica) fornece informações relevantes sobre

análise dos padrões de atividade dos genes nas

a fisiologia permitindo a detecção de novas e

células, tecidos e órgãos, se sabe agora a

importantes

localização

muitas

desenvolvimento, com o envelhecimento e com as

seqüências relacionadas a importantes questões

doenças. Esta informação é fundamentalmente

médicas. Devido ao enorme potencial econômico

importante

destes

informação genética é lida e implementada no

precisa

no

achados

genômicas

genoma

de

científicos,

e

como

o

proteínas

para

se

associadas

com

compreender

como

desenvolvimento de novas drogas, os interesses

desenvolvimento e no funcionamento

comerciais estão fortemente relacionados a estes

o

a

organismo viável.

protejo genoma e as brigas pelos direitos de
patentes

das

seqüências

de

DNA

de um

Muitos cientistas acreditam que os estudos

ainda

das seqüências completas obtidas

a partir dos

desconhecidas tem sido comparada à corrida do

modernos projetos de sequenciamento genético,

ouro no século 19.

irão contribuir muito para uma melhor compreensão
da Biologia dos organismos. Outra contribuição
importante está relacionada a grande quantidade

3. Genômica e Proteômica

de

DNA

em

suas

pesquisas

de

seqüências

de

Será que o DNA é a única forma de
armazenamento de informação que é herdada?
Não é tão simples afirmar que toda a informação

com o gene. Por outro lado, a abordagem de

herdada está unicamente na seqüência de DNA,

completos

pois devido o fato do mesmo ser incapaz de se

produz um acumulo sistemático de seqüências de

replicar sozinho fora do ambiente celular, se faz

DNA das quais não se tem nenhum conhecimento

necessário que, de alguma forma, o DNA seja lido.

sobre sua fisiologia e função, pondo a Biologia

Na célula esta leitura é feita por proteínas. A

molecular de ponta-cabeça. Tradicionalmente os

organização cromossômica, a interação e o arranjo

cientistas precisavam fazer uma varredura de

dos complexos DNA/proteínas também são parte

linhagens inteiras de células ou tecidos animais

da informação herdada, não apenas a seqüência do

para identificar um novo gene (através da técnica

DNA. Os banco de dados estão se expandindo

de Northern Blot). Agora eles podem fazer essa

muito

varredura eletronicamente nos banco de dados

sequenciamento

de

de

proteínas

mRNA
que

acomodar

são
dados

atualizados
novos

e

abril de 1988 até o final de 1999 os projetos

gerou um excelente atalho em relação ao método
isolamento

para

alguns

disponibiliza-los para a comunidade científica. De

fragmentos de genes (Northen eletrônico). Isto
de

rapidamente,

diariamente

públicos para a descoberta de novos genes ou

tradicional

muitos

genoma é a compreensão da vida!

traz consigo a informação sobre a função associada
genomas

em

sentido desta descoberta. A promessa dos projetos

genes

vantagem da abordagem gene a gene é que ela já

maciçamente

codificado

futuro, o caminho a ser seguido pelos cientistas no

distribuídos em vários bancos de dados públicos. A

sequenciar

é

conhecimento destas seqüências irá indicar, no

da Biologia celular e bioquímica resultou em uma
aleatória

não

desconhecido e não se sabia sua função. O

nas

universidades com interesse em diversos aspectos
coleção

que

organismos. Este DNA, até bem pouco tempo era

O esforço dos biólogos moleculares para
sequenciar

DNA

genoma cobriram 83 espécies com

e

completados

eram

21 projetos

(predominantemente

microorganismos) e no ano 2000 existiam 62

necessários para se obter às seqüências de DNA.

projetos em andamento. Estes projetos genoma

A sistemática de detecção e anotação de proteínas

4
são realizados através da clonagem automática por

4. Computação em Biologia e Medicina

PCR (polimerase chain reaction) ou reação em
cadeia da polimerase, que amplifica o DNA e pelos

A bioinformática utiliza como ferramentas a

sistemas de sequenciamento automático. Para a

matemática aplicada e a computação. A Biologia

reconstrução dos espaços vazios (gap-free) e união

molecular de hoje seria impossível sem os recursos

das seqüências contíguas (contigs) oriundas da

de bioinformática, tais como o armazenamento,

fragmentação aleatória dos cromossomos (shot-

distribuição e atualização das informações, as

gun) são utilizados softwares especiais que,

análises estatísticas, a modelagem de dados e a

realizam esta função em toda a seqüência do

simulação

genoma base por base.

diferentes

países.

Hoje

de

a

impossíveis

sem

os

inserção de sondas miniaturizadas no interior de

Internet, e aos projetos genoma que impulsionam o

vasos e na realização de delicadas técnicas de

incrível aperfeiçoamento das técnicas de clonagem

microcirurgias. A neurobiologia está começando a

e sequenciamento. Atualmente, a ciência tem sido,
negócio

seriam

ajudar os médicos em seus diagnósticos, como na

bancos de dados centralizados, a comunicação via

excelente

laboratório

equipamentos analíticos e a realidade virtual para

ciência independente graças ao advento dos

um

em

computadores. A medicina moderna utiliza muitos

bioinformática está sendo transformada em uma

considerada

biológicos

neurobiologia e o uso de sofisticados equipamentos

uma colaboração entre diferentes grupos de
em

fenômenos

computador. Pesquisas e tratamentos médicos,

Inicialmente, a bioinformática havia sido
pesquisas

de

mapear a anatomia cerebral e a composição

e,

celular, assim como os projetos genoma estão

conseqüentemente, muitas organizações públicas

mapeando os cromossomos. A neuroinformática

e privadas têm sido fundadas com o objetivo de

também é um novo e emergente ramo da

sequenciar genomas completos, mapear todos os

bioinformática. Ela surgiu através do esforço

genes e criar bancos de dados que relacionem às

colaborativo entre neurologistas, (cientistas que

seqüências com a estrutura e função celular.

estudam cognição) e psicólogos. O cérebro e os
neurônios

estão

sendo

encarados

como

um

sistema complexo que serve de modelo para o
desenvolvimento

de

redes

neurais

de

computadores, devido à forma com que os
neurônios

trabalham.

Algoritmos

genéticos

e

raciocínio não linear atualmente têm sido utilizados
para o desenvolvimento de inteligência artificial e
evolução

computacional.

(Veja:

The

Genetic

Algorithms Archive – um arquivo mantido por Alan
C. Shultz no Centro para pesquisa aplicada em
Inteligência

artificial

http://www.aic.nrl.navy.mil/galist/).

5

–
segundos, a facilidade de se mudar o layout do

5. Algoritmos Computacionais

texto e das figuras tem aumentando em grande
quantidade o desperdício de papel, simplesmente

Os computadores são essenciais para o

porque nós ainda queremos ver como vai ficar o

processamento de grandes quantidades de dados

produto final! Por outro lado às várias cópias

em tempo hábil para seu estudo. Contudo, os

produzidas das várias versões de um texto podem

computadores precisam de instruções, processo

ser economizadas pelas versões eletrônicas vistas

chamado de intervenção humana. Este processo de

no próprio monitor. Corretores ortográficos e

instrução analítica humana pode demandar muito

gramaticais são bons exemplos de um simples

tempo para resolver um problema usando o

algoritmo que pode fazer uma medida analítica da

computador. Atualmente muitos dos processos

linguagem. Uma das armadilhas dos corretores

automatizados têm como objetivo ensinar os
computadores

a

tomarem

decisões

ortográficos está na leitura de uma determinada

num

palavra dentro de um contexto, o computador não

determinado futuro (como o reconhecimento do

pode encontrar um erro ortográfico se a palavra

contexto de um problema). Sistemas inteligentes

estiver correta para um outro contexto (por

são programas que realizam determinadas tarefas

exemplo: conserto e concerto). A habilidade da

que requerem enorme poder computacional. As

mente

situações da vida real nunca são totalmente
decisões

baseadas

atualmente

em

analisar

e

reconhecer

corretamente, falas, estilos e gramática não é

reprodutíveis para os computadores comuns e
muitas

humana

reproduzida satisfatoriamente pelos computadores

na

porque

intervenção humana estão sendo projetadas para

mentes

e

computadores

trabalham

diferentemente. O funcionamento da correção

serem manipuladas por redes neurais (Neural

ortográfica é muito parecido com a análise de

Networks –NNs) que são sistemas que possuem a

dados científicos e sua subseqüente interpretação

habilidade de aprender. As redes neurais embora

quando feito pelos computadores, mas apenas sob

sejam uma boa promessa para o futuro, ainda são

o restrito controle da mente humana.

difíceis de se aplicar de forma bem sucedida em

Os

problemas relativos a manipulação de símbolos e

computadores

são

excelentes

ferramentas para soluções numéricas (análises e

memória. Além disso não existe um método de

simulações), controle de máquinas, edição e busca

treinamento de NNs que permita, de forma mágica,

de caracteres em textos, busca de relação entre

que elas criem alguma informação que não esteja

dados e gerenciamento de base de dados. As

contida nos dados previamente informados (Neural

ultimas

Network FAQ; ftp://ftp.sas.com/pub/neural/FAQ.html

três aplicações

bioinformática.

). Alguns algoritmos podem ser desenvolvidos para
funcionarem de forma eficiente em computadores
que respondem questões repetitivas onde os dados
informados e obtidos variam constantemente e
podem ser gerados e ajustados pelo próprio
processo como num feedback.
O poder dos computadores é inegável. A
facilidade de se escrever um texto em um
processador de texto, por exemplo, se tornou uma
ferramenta tão popular que hoje em dia pode ser
considerada indispensável. Embora a formatação
de um texto possa ser feita em questão de

6

são

cruciais

para

a
6. Diferentes tipos de computadores

de diferentes comprimentos de onda, incluindo

para diferentes tarefas

medidas em tempo real para o monitoramento de
mudanças na composição química de soluções. Os
cromatógrafos fazem a separação de misturas

Os computadores pessoais (PCs) são

moleculares como componentes individuais de

multifacetados e são usados para várias tarefas

acordo com seu tamanho e solubilidade. Estes

como processamento de texto, planilhas de cálculo,

equipamentos

apresentações e acesso a Internet. Com softwares
especializados

também

podem

Instruments

software

(http://www.axon.com/)

aplicativo

largamente

usado

para

dinheiro ou efetua o pagamento de uma conta, mas
você não pode editar um texto ou alterar o
programa.

e

alinhamento de múltiplas seqüências de DNA
da

existência de supercomputadores. Os laboratórios
podem ser equipados com várias opções de
interfaces com PCs que ajudam nas pesquisas em
que

atendam

as

necessidades

específicas dos experimentos.
Estima-se que apenas 1% de todos os
microprocessadores no mundo estejam nos PCs.
Os outros 99% estão envolvidos em muitos outros
produtos espalhados pelo mundo, como aeronaves,
sistemas

de

refrigeração

e

aquecimento,

instrumentos de laboratório, sistemas de segurança
e outros dispositivos. Estes processadores são
comumente referidos como “firmware”, que são
chips que tem como função especial realizar tarefas
sem a necessidade de programação.
A

ciência

requer

o

uso

de

os

computador que realiza a transferência de seu

dos PCs em redes locais, têm guiado os cientistas

aplicações

geral

acessar sua conta bancária, você interage com o

velocidade e o aumento do poder computacional

independentemente

Em

para

onde um pequeno teclado pode ser usado para

movimento (ex.: Mal de Parkinson). A versatilidade,

molecular)

interfaces

funcionam essencialmente como caixas eletrônicos,

diagnóstico e monitoramento de distúrbios do

(evolução

remotos.

com

digitado ou selecionado a partir de um menu. Eles

microeletrodos em neurocirurgia funcional e no

molecular

porém

de código ou comando de texto que pode ser

hibridização de fragmentos de DNA, para guiar

modelagem

fim,

pequenas telas que mostram uma ou mais linhas

concentração de íons, para analisar os padrões de

com

por

microprocessadores são acessíveis através de

em

atividade elétrica em neurônios, na medida da

trabalho

este

computadores

um

eletrofisiologia para o controle e medida da

no

controlados

microprocessadores construídos especificamente

controlar

equipamentos de laboratório como o pClamp da
Axon

são

muitos

equipamentos que usam processadores, como
cromatógrafos a gás, balanças computadorizadas e
espectrofotômetros. Os espectrofotômetros são
usados para ler o espectro de absorção luminosa

7
Finalmente, a Internet é uma rede de

7. Supercomputadores

supercomputadores e estações de trabalho (PCs)
conectados através de switches, roteadores e

Os supercomputadores são usados para
tarefas

que

computacional

demandem
e

cabos de fibra óptica. A grande força da Internet é o

poder

necessitem

que

grande

grande

modo

interativo

remoto.

A

maior

parte

dos

capacidade de armazenamento e memória. Eles

aplicativos disponíveis na World Wide Web (www)

são os servidores principais dos provedores de

roda

Internet

dispensando a necessidade de downloads de

e

a

maior

parte

utiliza

o

sistema

através

de

supercomputadores

remotos

sido

softwares para análise local. A bioinformática é um

implementado em muitas comunidades científicas

exemplo de que a Internet tem sido parte integral

devido a sua alta capacidade e baixo preço.

da pesquisa científica e que sua necessidade e uso

operacional

UNIX.

Este

sistema

tem

através de programas remotos se tornaram cada

Em 20 de junho de 1997 pesquisadores do

vez mais importante.

centro de supercomputadores de Pittsburgh Nos
Estados Unidos e a Universidade de Stuttgart na
Alemanha conectaram supercomputadores dos dois

8. Limitações na análise computacional

lados do atlântico via rede de pesquisas de alta

– A promessa paradoxal da Internet.

velocidade. Esta foi a primeira vez em uma rede de
telecomunicação de alta velocidade (Very High
Speed Backbone Network Service – vBNS) para

Quando um experimento é terminado, os

transmissão de dados de computador através do

dados acumulados precisam ser analisados ou

atlântico. Considerado como protótipo para a rede

processados. Isto inclui a tabulação de bases de

internacional de alta performance, um projeto

dados,

colaborativo entre o processador CRAY T3E com

correlacionais e, o mais importante de todos, a

outro processador de alta performance de Stuttgart.

seleção dos dados que podem ser analisados e

O trabalho de computação realizado por dois

utilizados para interpretação dos fenômenos. Este

supercomputadores

de

último é um processo que é independente do

trabalho e conectados entre si é conhecido como

computador e evidentemente dependa da confiança

“metacomputação”. O link Pittsburgh-Stuttgart criou

do cientista em seus experimentos. O julgamento

um sistema virtual de 1024 processadores com a

da qualidade dos dados pode enganar aos olhos do

performance teórica de 675 bilhões de cálculos por

observador, uma vez que o que se espera ver está

segundo! O projeto permitiu o desenvolvimento de

baseado na hipótese na qual os experimentos

várias redes de pesquisas através da conexão de

foram fundamentados.

em

diferentes

locais

realização

de

testes

estatísticos

ou

alta velocidade entre os dois centros através do

A intuição e a interferência dos cientistas

atlântico. Cada nova rede estabelecida nos últimos

são os fatores mais importantes na tomada de

anos permitiu a transmissão de informações a uma

decisões corretas. É claro que os computadores

velocidade 100 vezes mais rápida que a Internet

podem ajudar, mas apenas com softwares que

convencional. Por exemplo, o vBNS que conecta os

tenham sido desenvolvidos especificamente para

centro de supercomputadores dos Estados Unidos,

aquela análise, ou seja através da intervenção

atualmente pode transmitir em velocidades em

humana. Enquanto que o processo analítico pode

trono de 622 milhões de bits por segundo,

ser feito exclusivamente por computadores, a

velocidade

interpretação dos dados não pode ser feita por um

suficiente

para

transferir

toda

a

computador por si só. Contudo, computadores

Enciclopédia Britânica em menos de 10 segundos.

podem ajudar a análise de dados avaliando cada

8
variável de um experimento e lendo os dados de

produziram

forma mais consistente, o que não poderia ser

função biológica associada. Obviamente esse era

observado superficialmente pelo cientista.

seu objetivo. Espera-se que se possam extrair

muitas

seqüências

sem

nenhuma

Nenhum manual técnico, livro ou a Internet

informações ordenadas de modo a orientar novos

podem sobrepor a experiência. O estudo e o ganho

experimentos que colaborem para desvendar a

de experiência são os fatores mais importantes

Biologia por trás destas seqüências.

neste estágio do processo científico.É aqui que a
Internet oferece uma importante ajuda para os

9.

cientistas. Contudo, as informações encontradas

computacionais

em

livros

texto,

páginas

com

instruções

causar

impressão

aspectos da vida. As neurociências concentram-se
na Biologia dos neurônios. A bioquímica se detém

um livro em uma biblioteca ou realizar um curso

na química dos organismos vivos. A Biologia

tradicional de longa distância. A razão de insistir

molecular estuda as interações biológicas em nível

neste ponto é que saibamos que a precisão dos

molecular e suas interferências para as células e

dados gerados por computador depende do quanto
são

manuseadas

as
pelo

informações
operador

fornecidas

humano.

para o organismo como um todo. A virologia e a

e

Não

bacteriologia concentram-se nos ciclos de vidas de

é

vírus e de bactérias, respectivamente. Muitos

nenhum segredo que as bases de dados de DNA e

outros aspectos da Biologia se concentram em

proteínas contém erros conseqüentes da origem e

tópicos específicos da Biologia que são importantes

da forma com que as seqüências foram obtidas. O
sucesso

da

bioinformática

está

para cada campo particular. É indiscutível a

diretamente

importância que cada um destes aspectos da

vinculado a uma anotação completa e confiável das

Biologia

seqüências nas bases de dados e com a precisão

de

informação,

para

o

outro.

A

grande

se tornando mais obvia com o avanço nas

não será por muito tempo. Para tornar as bases de
confiáveis

ter

fornecidas por cada um destes campos agora está

de precisão das anotações não é automatizado e
fontes

pode

sobreposição de dados que existe nas informações

dos dados biológicos. Este processo de checagem

dados

Ferramentas

campos multifacetados concentrando um ou mais

contrária.

Atualmente a Internet não é mais interativa que ler

correto

de

Atualmente a Biologia e a medicina são

experiência prática, embora a natureza interativa da
possa

necessidade

e

protocolos de laboratório não são substitutos para a
Internet

A

ferramentas

são

de

conseqüentemente,

necessários muitos especialistas para analisar

manipulação

de

dados

e,

necessita

do

uso

de

ferramentas computacionais mais elaboradas.

palavra por palavra.

O incrível avanço na Biologia e na medicina

A comparação de seqüências de genes

durante as últimas décadas tem criado um

usando programas como o BLAST é razoavelmente

feedback positivo, onde cada novo achado serve

fácil, mas a compreensão verdadeira do que os

como guia para o crescimento e popularidade de

resultados desta comparação significam pode ser

um determinado campo da Biologia. Isto também

extremamente difícil. Os resultados dependem dos

gera um crescimento exponencial dos dados

tipos de seqüências comparadas e da origem

biológicos. Desta forma também se faz necessário

destas seqüências. Ou seja é necessário se

um poderoso e eficiente sistema de manipulação de

compreender a Biologia por trás da seqüência que

dados biológicos, o que parece óbvio, mas sem o

está armazenada na base de dados e por

poder dos computadores isto seria inimaginável. Os

comparação chegar a alguma conclusão a respeito

computadores são agora parte integrante do mundo

das novas seqüências. Os projetos genomas

biológico e sem eles, os atuais avanços na Biologia

9
e na medicina seriam, sem dúvida, impossíveis. A

demais em um sistema biológico. A simples

parceria

vivas

separação de moléculas em categorias específicas

(computadores) e a Biologia criou a necessidade de

não é o suficiente. Os sistemas de gerenciamento

se fundir certos aspectos destas duas ciências.

de dados devem ser capazes de mostrar a relação

Novos campos, como a ciência da computação em

existente nas informações contidas nas moléculas

medicina,

de interesse. As informações em um arquivo

entre

a

estas

criaturas

bioengenharia

não

e

a

Biologia

computacional estão em franca ascensão e estão

específico

ganhando grande respeito dentro das ciências da

relacionados em outros sites relevantes. Por

vida. O objetivo destes campos é a rápida análise

exemplo, no sumário do arquivo PDB da mioglobina

de dados biológicos e a descoberta de informações

de cavalo devem existir várias opções de links para

biológicas

várias informações relacionadas à molécula da

podem

desconhecidas.

ser

ferramentas

Estas
úteis

informações
em

avanços

devem

conter

links

para

dados

mioglobina. Estas informações relativas a um

terapêuticos no prolongamento e melhoramento da

determinado

qualidade de vida.

informações potencialmente úteis sobre outras

dado

permite-nos

avaliar

outras

A introdução da Internet na Biologia foi um
bastante

fato

moléculas em outros sistemas e em outros
servidores na Internet.

positivo,

dramaticamente

a

tem

comunicação

aumentado
entre

os

pesquisadores e reduzido a repetição de trabalhos
em várias áreas da pesquisa científica em todo o
mundo. A existência de sistemas gerenciadores de
dados como o National Center for Biotechnology
Information (NCBI - http://www.ncbi.nlm.nih.gov) e
o

European

Bioinformatics

Institute

(EBI

-

http://www.ebi.ac.uk/ ) tem aumentado a eficiência
de muitos pesquisadores em todo o mundo e
unindo cientistas oriundos de diferentes disciplinas.
O crescimento exponencial dos dados biológicos
requer uma organização específica nas bases de
dados através de sistemas especializados para
cada tipo de informação. Por exemplo, os dados
biológicos pertinentes às proteínas precisam ser
separados dos polinucleotídeos (DNA e RNA). Os
bancos de dados de proteínas (PDB – Protein Data
Bank) são exemplos de sistema onde os dados das
proteínas são armazenados especificamente como
estruturas protéicas. Assim como muitos outros
bancos de dados biológicos, o PDB permite a
comparação entre diversas moléculas estocadas.
No PDB, estas informações podem ser obtidas a
partir da classificação estrutural das proteínas.
Base

de

dados

como

o

SCOP

(Structural

classification of Proteins) são ferramentas úteis na
caracterização de macromoléculas em relação as

10
10. Novas descobertas em Pesquisa
científica com computadores
Problemas biológicos ainda sem solução
são

agora

os

principais

temas

da

Biologia

computacional no mundo. A Bioquímica, a Biofísica,
a Biologia molecular, a Biologia evolucionária, a
Bioinformática, as neurociências e a Farmacologia
são apenas alguns dos campos das ciências
naturais

que

têm

sido

significativamente

influenciados pelas ferramentas computacionais. Ao
contrário dos fenômenos da física, os fenômenos
biológicos, até recentemente, eram considerados
imprevisíveis e muitos dos seus aspectos eram
considerados
ferramentas
reduzido

indescritíveis.
computacionais

brutalmente

os

A

introdução

de

Biologia

tem

na

problemas

com

o

manuseio de dados e mais importante que isso,
tem permitido a observação da relação existente
entre as moléculas biológicas em seus respectivos
campos

da

Biologia.

As

novas

informações

biológicas aliadas com o aumento da nossa
habilidade em prever fenômenos biológicos têm
reforçado muito o avanço da Biologia. A idéia da
Biologia como uma ciência previsível é um estímulo
para muitos cientistas, o que tem afastado a visão
das ciências biológicas como ficção científica. A
sociedade como um todo tem dedicado grande
atenção à Biologia e a Medicina nas últimas
décadas graças aos avanços ocorridos como a
introdução de novas drogas e tratamentos que
prolongam e aumentam a qualidade de vida. Estas
novidades tem sido instrumento para colocar vários
campos da Biologia, como a Bioquímica e a
Biologia Molecular no pedestal da ciência

Adaptado de Bioinformatic Basics – Applications
in Biological Science and Medicine. Hooman H.
Rashidi e Buehle. CRC EUA 2000.

11

Mais conteúdo relacionado

Mais procurados

Engenharia genética
Engenharia genéticaEngenharia genética
Engenharia genética
Aleni Fonseca
 
Biotecnologia
BiotecnologiaBiotecnologia
Biotecnologia
letyap
 
Engenharia genética e produção de medicamentos
Engenharia genética e produção de medicamentos Engenharia genética e produção de medicamentos
Engenharia genética e produção de medicamentos
Cláudia Tavares
 
Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)
Bio
 
Engenharia genética
Engenharia genéticaEngenharia genética
Engenharia genética
paulober
 
Apresentação da aula de biotecnologia
Apresentação da aula de biotecnologia Apresentação da aula de biotecnologia
Apresentação da aula de biotecnologia
Seleste Mendes Pereira
 
Curvas de sobrevida celular 2013
Curvas de sobrevida celular 2013Curvas de sobrevida celular 2013
Curvas de sobrevida celular 2013
Mark Lagos
 
Aplicação da Engenharia Genética na Medicina
Aplicação da Engenharia Genética na MedicinaAplicação da Engenharia Genética na Medicina
Aplicação da Engenharia Genética na Medicina
António Morais
 

Mais procurados (20)

Neoplasias
NeoplasiasNeoplasias
Neoplasias
 
Engenharia genética
Engenharia genéticaEngenharia genética
Engenharia genética
 
Engenharia Genética
Engenharia Genética Engenharia Genética
Engenharia Genética
 
Engenharia genética
Engenharia genética Engenharia genética
Engenharia genética
 
Aula 12 - Tecnologia do DNA recombinante
Aula 12 - Tecnologia do DNA recombinanteAula 12 - Tecnologia do DNA recombinante
Aula 12 - Tecnologia do DNA recombinante
 
Biotecnologia
BiotecnologiaBiotecnologia
Biotecnologia
 
Engenharia genética e produção de medicamentos
Engenharia genética e produção de medicamentos Engenharia genética e produção de medicamentos
Engenharia genética e produção de medicamentos
 
Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)
 
Citologia
CitologiaCitologia
Citologia
 
Engenharia genética
Engenharia genéticaEngenharia genética
Engenharia genética
 
Aula biotecnologia
Aula biotecnologiaAula biotecnologia
Aula biotecnologia
 
Apresentação da aula de biotecnologia
Apresentação da aula de biotecnologia Apresentação da aula de biotecnologia
Apresentação da aula de biotecnologia
 
Fundamentos de Engenharia Genética
Fundamentos de Engenharia GenéticaFundamentos de Engenharia Genética
Fundamentos de Engenharia Genética
 
Estudo dirigido i bcm prof_marconi
Estudo dirigido i bcm prof_marconiEstudo dirigido i bcm prof_marconi
Estudo dirigido i bcm prof_marconi
 
Modelo Linear Quadrático - Conteúdo vinculado ao blog http://fisicanoene...
Modelo Linear Quadrático - Conteúdo vinculado ao blog      http://fisicanoene...Modelo Linear Quadrático - Conteúdo vinculado ao blog      http://fisicanoene...
Modelo Linear Quadrático - Conteúdo vinculado ao blog http://fisicanoene...
 
Biotecnologia
BiotecnologiaBiotecnologia
Biotecnologia
 
Biotecnologia
BiotecnologiaBiotecnologia
Biotecnologia
 
Curvas de sobrevida celular 2013
Curvas de sobrevida celular 2013Curvas de sobrevida celular 2013
Curvas de sobrevida celular 2013
 
DNA recombinante
DNA recombinanteDNA recombinante
DNA recombinante
 
Aplicação da Engenharia Genética na Medicina
Aplicação da Engenharia Genética na MedicinaAplicação da Engenharia Genética na Medicina
Aplicação da Engenharia Genética na Medicina
 

Destaque

Mecanismos Básicos da Genética Molecular
Mecanismos Básicos da Genética MolecularMecanismos Básicos da Genética Molecular
Mecanismos Básicos da Genética Molecular
Gregorio Leal da Silva
 
Conceitos Básicos de Técnicas em Biologia Molecular - Embrapa
Conceitos Básicos de Técnicas em Biologia Molecular - EmbrapaConceitos Básicos de Técnicas em Biologia Molecular - Embrapa
Conceitos Básicos de Técnicas em Biologia Molecular - Embrapa
Gregorio Leal da Silva
 
Relatório final identificação da ictiofauna
Relatório final   identificação da ictiofaunaRelatório final   identificação da ictiofauna
Relatório final identificação da ictiofauna
Arao Da Cruz Zunguza
 
Apostila curso estatistica_goes
Apostila curso estatistica_goesApostila curso estatistica_goes
Apostila curso estatistica_goes
Stefania Helena
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
Robson Odé
 
Probabilidade E Bioestatística
Probabilidade E BioestatísticaProbabilidade E Bioestatística
Probabilidade E Bioestatística
Rodrigo Vianna
 
Livro estatística fácil antônio arnot crespo - ed saraiva
Livro estatística fácil   antônio arnot crespo - ed saraivaLivro estatística fácil   antônio arnot crespo - ed saraiva
Livro estatística fácil antônio arnot crespo - ed saraiva
Pablo Cotes
 
Slide de Estatística Aplicada à Educação
Slide de Estatística Aplicada à EducaçãoSlide de Estatística Aplicada à Educação
Slide de Estatística Aplicada à Educação
Eduardo Alves dos Reis
 
Morettin estatistica básica, probabilidade
Morettin   estatistica básica, probabilidadeMorettin   estatistica básica, probabilidade
Morettin estatistica básica, probabilidade
lalabbesteves
 
Estatística completa
Estatística completaEstatística completa
Estatística completa
Ronne Seles
 
Nocoes basicas de estatistica
Nocoes basicas de estatistica Nocoes basicas de estatistica
Nocoes basicas de estatistica
Helena Borralho
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
Antonio Mankumbani Chora
 

Destaque (20)

Mecanismos Básicos da Genética Molecular
Mecanismos Básicos da Genética MolecularMecanismos Básicos da Genética Molecular
Mecanismos Básicos da Genética Molecular
 
Conceitos Básicos de Técnicas em Biologia Molecular - Embrapa
Conceitos Básicos de Técnicas em Biologia Molecular - EmbrapaConceitos Básicos de Técnicas em Biologia Molecular - Embrapa
Conceitos Básicos de Técnicas em Biologia Molecular - Embrapa
 
Apostila Básica de Entomologia
Apostila Básica de Entomologia Apostila Básica de Entomologia
Apostila Básica de Entomologia
 
Relatório final identificação da ictiofauna
Relatório final   identificação da ictiofaunaRelatório final   identificação da ictiofauna
Relatório final identificação da ictiofauna
 
Ornitologia Básica
Ornitologia Básica Ornitologia Básica
Ornitologia Básica
 
Apostila de Bioestatística
Apostila de BioestatísticaApostila de Bioestatística
Apostila de Bioestatística
 
Apostila curso estatistica_goes
Apostila curso estatistica_goesApostila curso estatistica_goes
Apostila curso estatistica_goes
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
 
Probabilidade E Bioestatística
Probabilidade E BioestatísticaProbabilidade E Bioestatística
Probabilidade E Bioestatística
 
Livro estatística fácil antônio arnot crespo - ed saraiva
Livro estatística fácil   antônio arnot crespo - ed saraivaLivro estatística fácil   antônio arnot crespo - ed saraiva
Livro estatística fácil antônio arnot crespo - ed saraiva
 
Técnicas básicas de biologia molecular
Técnicas básicas de biologia molecularTécnicas básicas de biologia molecular
Técnicas básicas de biologia molecular
 
Slide de Estatística Aplicada à Educação
Slide de Estatística Aplicada à EducaçãoSlide de Estatística Aplicada à Educação
Slide de Estatística Aplicada à Educação
 
Morettin estatistica básica, probabilidade
Morettin   estatistica básica, probabilidadeMorettin   estatistica básica, probabilidade
Morettin estatistica básica, probabilidade
 
Estatística completa
Estatística completaEstatística completa
Estatística completa
 
Apostila Sistemática de Peixes
Apostila Sistemática de PeixesApostila Sistemática de Peixes
Apostila Sistemática de Peixes
 
Estatística
EstatísticaEstatística
Estatística
 
TÉCNICAS DE BIOLOGÍA MOLECULAR
TÉCNICAS DE BIOLOGÍA MOLECULAR TÉCNICAS DE BIOLOGÍA MOLECULAR
TÉCNICAS DE BIOLOGÍA MOLECULAR
 
Nocoes basicas de estatistica
Nocoes basicas de estatistica Nocoes basicas de estatistica
Nocoes basicas de estatistica
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
 
Caderno de Exercícios – Estatística com solução
Caderno de Exercícios – Estatística com soluçãoCaderno de Exercícios – Estatística com solução
Caderno de Exercícios – Estatística com solução
 

Semelhante a Bioinformática Apostila de Introdução

InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de DoençasInfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
Carlos Carvalho
 
Aula 6 EPIGENÉTICA NUTRIGENÉTICA E CARCINOGENESE.pptx
Aula 6 EPIGENÉTICA NUTRIGENÉTICA E CARCINOGENESE.pptxAula 6 EPIGENÉTICA NUTRIGENÉTICA E CARCINOGENESE.pptx
Aula 6 EPIGENÉTICA NUTRIGENÉTICA E CARCINOGENESE.pptx
RomuloHalley1
 
Plano de unidade 3º ano cetepa
Plano de unidade  3º ano cetepaPlano de unidade  3º ano cetepa
Plano de unidade 3º ano cetepa
familiaestagio
 
Biologia 11 preparação para exame 1
Biologia 11   preparação para exame 1Biologia 11   preparação para exame 1
Biologia 11 preparação para exame 1
Nuno Correia
 
Bioquimicacarboidratoslipdeoseprotenas 100320060818-phpapp01
Bioquimicacarboidratoslipdeoseprotenas 100320060818-phpapp01Bioquimicacarboidratoslipdeoseprotenas 100320060818-phpapp01
Bioquimicacarboidratoslipdeoseprotenas 100320060818-phpapp01
Bru Resende
 

Semelhante a Bioinformática Apostila de Introdução (20)

Projeto Genoma Humano.pdf
Projeto Genoma Humano.pdfProjeto Genoma Humano.pdf
Projeto Genoma Humano.pdf
 
InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de DoençasInfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
 
Melhoramento genetico brasilia
Melhoramento genetico brasiliaMelhoramento genetico brasilia
Melhoramento genetico brasilia
 
grandes temas em biologia_aula_07_volume01
grandes temas em biologia_aula_07_volume01grandes temas em biologia_aula_07_volume01
grandes temas em biologia_aula_07_volume01
 
Sequenciação do genoma Humano
Sequenciação do genoma HumanoSequenciação do genoma Humano
Sequenciação do genoma Humano
 
Exploring the Applications and Potential of Bioinformatics
Exploring the Applications and Potential of BioinformaticsExploring the Applications and Potential of Bioinformatics
Exploring the Applications and Potential of Bioinformatics
 
Aula 6 EPIGENÉTICA NUTRIGENÉTICA E CARCINOGENESE.pptx
Aula 6 EPIGENÉTICA NUTRIGENÉTICA E CARCINOGENESE.pptxAula 6 EPIGENÉTICA NUTRIGENÉTICA E CARCINOGENESE.pptx
Aula 6 EPIGENÉTICA NUTRIGENÉTICA E CARCINOGENESE.pptx
 
Slides-resumo_Ciências_biológicas_5.pdf
Slides-resumo_Ciências_biológicas_5.pdfSlides-resumo_Ciências_biológicas_5.pdf
Slides-resumo_Ciências_biológicas_5.pdf
 
Artigo para o tralho
Artigo para o tralhoArtigo para o tralho
Artigo para o tralho
 
Plano de unidade 3º ano cetepa
Plano de unidade  3º ano cetepaPlano de unidade  3º ano cetepa
Plano de unidade 3º ano cetepa
 
Biologia 11 preparação para exame 1
Biologia 11   preparação para exame 1Biologia 11   preparação para exame 1
Biologia 11 preparação para exame 1
 
Dogma central da biologia parte 1 videoaula
Dogma central da biologia parte 1 videoaulaDogma central da biologia parte 1 videoaula
Dogma central da biologia parte 1 videoaula
 
Engenharia genética
Engenharia genéticaEngenharia genética
Engenharia genética
 
Aula 1 - Fundamentos de Bioengenharia e Biotecnologia.pptx
Aula 1 - Fundamentos de Bioengenharia e Biotecnologia.pptxAula 1 - Fundamentos de Bioengenharia e Biotecnologia.pptx
Aula 1 - Fundamentos de Bioengenharia e Biotecnologia.pptx
 
grandes temas em biologia_aula_05_volume01
grandes temas em biologia_aula_05_volume01grandes temas em biologia_aula_05_volume01
grandes temas em biologia_aula_05_volume01
 
Biotecnologia agricola
Biotecnologia agricolaBiotecnologia agricola
Biotecnologia agricola
 
Bioquimicacarboidratoslipdeoseprotenas 100320060818-phpapp01
Bioquimicacarboidratoslipdeoseprotenas 100320060818-phpapp01Bioquimicacarboidratoslipdeoseprotenas 100320060818-phpapp01
Bioquimicacarboidratoslipdeoseprotenas 100320060818-phpapp01
 
U2
U2U2
U2
 
Melhoramento genético
Melhoramento genéticoMelhoramento genético
Melhoramento genético
 
Bioinformatica e genomica-george_carvalho
Bioinformatica e genomica-george_carvalhoBioinformatica e genomica-george_carvalho
Bioinformatica e genomica-george_carvalho
 

Mais de Gregorio Leal da Silva

APOSTILA DE FISIOLOGIA HUMANA – CTPAC – TÉC. ANÁLISES CLÍNICAS - Prof.ª DIANA...
APOSTILA DE FISIOLOGIA HUMANA – CTPAC – TÉC. ANÁLISES CLÍNICAS - Prof.ª DIANA...APOSTILA DE FISIOLOGIA HUMANA – CTPAC – TÉC. ANÁLISES CLÍNICAS - Prof.ª DIANA...
APOSTILA DE FISIOLOGIA HUMANA – CTPAC – TÉC. ANÁLISES CLÍNICAS - Prof.ª DIANA...
Gregorio Leal da Silva
 
O dia-a-dia Hematológico na Patologia Clínica
O dia-a-dia Hematológico na Patologia Clínica O dia-a-dia Hematológico na Patologia Clínica
O dia-a-dia Hematológico na Patologia Clínica
Gregorio Leal da Silva
 
APOSTILA DE AULAS PRÁTICAS BACTERIOLOGIA
APOSTILA  DE  AULAS PRÁTICAS BACTERIOLOGIA APOSTILA  DE  AULAS PRÁTICAS BACTERIOLOGIA
APOSTILA DE AULAS PRÁTICAS BACTERIOLOGIA
Gregorio Leal da Silva
 
Biotecnologia: cultivo de células vegetais
Biotecnologia: cultivo de células vegetais Biotecnologia: cultivo de células vegetais
Biotecnologia: cultivo de células vegetais
Gregorio Leal da Silva
 
APOSTILA DE MORFOLOGIA EXTERNA VEGETAL
APOSTILA DE MORFOLOGIA EXTERNA VEGETALAPOSTILA DE MORFOLOGIA EXTERNA VEGETAL
APOSTILA DE MORFOLOGIA EXTERNA VEGETAL
Gregorio Leal da Silva
 

Mais de Gregorio Leal da Silva (17)

APOSTILA DE FISIOLOGIA HUMANA – CTPAC – TÉC. ANÁLISES CLÍNICAS - Prof.ª DIANA...
APOSTILA DE FISIOLOGIA HUMANA – CTPAC – TÉC. ANÁLISES CLÍNICAS - Prof.ª DIANA...APOSTILA DE FISIOLOGIA HUMANA – CTPAC – TÉC. ANÁLISES CLÍNICAS - Prof.ª DIANA...
APOSTILA DE FISIOLOGIA HUMANA – CTPAC – TÉC. ANÁLISES CLÍNICAS - Prof.ª DIANA...
 
apostila de embriologia
apostila de embriologiaapostila de embriologia
apostila de embriologia
 
Noções de Paleontologia
Noções de PaleontologiaNoções de Paleontologia
Noções de Paleontologia
 
Imunologia
Imunologia Imunologia
Imunologia
 
APOSTILA DE HISTOLOGIA BÁSICA
APOSTILA DE HISTOLOGIA BÁSICA APOSTILA DE HISTOLOGIA BÁSICA
APOSTILA DE HISTOLOGIA BÁSICA
 
O dia-a-dia Hematológico na Patologia Clínica
O dia-a-dia Hematológico na Patologia Clínica O dia-a-dia Hematológico na Patologia Clínica
O dia-a-dia Hematológico na Patologia Clínica
 
OCEANOGRAFIA BIOLÓGICA
OCEANOGRAFIA BIOLÓGICA OCEANOGRAFIA BIOLÓGICA
OCEANOGRAFIA BIOLÓGICA
 
Poligrafo1
Poligrafo1Poligrafo1
Poligrafo1
 
APOSTILA DE MICOLOGIA CLÍNICA
APOSTILA DE MICOLOGIA CLÍNICA APOSTILA DE MICOLOGIA CLÍNICA
APOSTILA DE MICOLOGIA CLÍNICA
 
APOSTILA DE AULAS PRÁTICAS BACTERIOLOGIA
APOSTILA  DE  AULAS PRÁTICAS BACTERIOLOGIA APOSTILA  DE  AULAS PRÁTICAS BACTERIOLOGIA
APOSTILA DE AULAS PRÁTICAS BACTERIOLOGIA
 
Biotecnologia: cultivo de células vegetais
Biotecnologia: cultivo de células vegetais Biotecnologia: cultivo de células vegetais
Biotecnologia: cultivo de células vegetais
 
Meio ambiente, sociedade e educação
Meio ambiente, sociedade e educaçãoMeio ambiente, sociedade e educação
Meio ambiente, sociedade e educação
 
APOSTILA ZOOLOGIA DOS VERTEBRADOS
APOSTILA ZOOLOGIA DOS  VERTEBRADOSAPOSTILA ZOOLOGIA DOS  VERTEBRADOS
APOSTILA ZOOLOGIA DOS VERTEBRADOS
 
ACIDENTES OFÍDICOS
ACIDENTES OFÍDICOS ACIDENTES OFÍDICOS
ACIDENTES OFÍDICOS
 
FUNDAMENTOS DE BIOQUIMICA
FUNDAMENTOS DE  BIOQUIMICAFUNDAMENTOS DE  BIOQUIMICA
FUNDAMENTOS DE BIOQUIMICA
 
APOSTILA DE MORFOLOGIA EXTERNA VEGETAL
APOSTILA DE MORFOLOGIA EXTERNA VEGETALAPOSTILA DE MORFOLOGIA EXTERNA VEGETAL
APOSTILA DE MORFOLOGIA EXTERNA VEGETAL
 
Exercícios sobre Divisão Celular
Exercícios sobre Divisão Celular Exercícios sobre Divisão Celular
Exercícios sobre Divisão Celular
 

Último

O Reizinho Autista.pdf - livro maravilhoso
O Reizinho Autista.pdf - livro maravilhosoO Reizinho Autista.pdf - livro maravilhoso
O Reizinho Autista.pdf - livro maravilhoso
VALMIRARIBEIRO1
 
Gramática - Texto - análise e construção de sentido - Moderna.pdf
Gramática - Texto - análise e construção de sentido - Moderna.pdfGramática - Texto - análise e construção de sentido - Moderna.pdf
Gramática - Texto - análise e construção de sentido - Moderna.pdf
Kelly Mendes
 
Regulamento do Festival de Teatro Negro - FESTIAFRO 2024 - 10ª edição - CEI...
Regulamento do Festival de Teatro Negro -  FESTIAFRO 2024 - 10ª edição -  CEI...Regulamento do Festival de Teatro Negro -  FESTIAFRO 2024 - 10ª edição -  CEI...
Regulamento do Festival de Teatro Negro - FESTIAFRO 2024 - 10ª edição - CEI...
Eró Cunha
 

Último (20)

Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...
Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...
Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...
 
Peça de teatro infantil: A cigarra e as formigas
Peça de teatro infantil: A cigarra e as formigasPeça de teatro infantil: A cigarra e as formigas
Peça de teatro infantil: A cigarra e as formigas
 
Poema - Maio Laranja
Poema - Maio Laranja Poema - Maio Laranja
Poema - Maio Laranja
 
"Nós Propomos! Escola Secundária em Pedrógão Grande"
"Nós Propomos! Escola Secundária em Pedrógão Grande""Nós Propomos! Escola Secundária em Pedrógão Grande"
"Nós Propomos! Escola Secundária em Pedrógão Grande"
 
Nós Propomos! Canil/Gatil na Sertã - Amigos dos Animais
Nós Propomos! Canil/Gatil na Sertã - Amigos dos AnimaisNós Propomos! Canil/Gatil na Sertã - Amigos dos Animais
Nós Propomos! Canil/Gatil na Sertã - Amigos dos Animais
 
O Reizinho Autista.pdf - livro maravilhoso
O Reizinho Autista.pdf - livro maravilhosoO Reizinho Autista.pdf - livro maravilhoso
O Reizinho Autista.pdf - livro maravilhoso
 
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptxEBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
 
Gramática - Texto - análise e construção de sentido - Moderna.pdf
Gramática - Texto - análise e construção de sentido - Moderna.pdfGramática - Texto - análise e construção de sentido - Moderna.pdf
Gramática - Texto - análise e construção de sentido - Moderna.pdf
 
Poema - Aedes Aegypt.
Poema - Aedes Aegypt.Poema - Aedes Aegypt.
Poema - Aedes Aegypt.
 
Slides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptx
Slides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptxSlides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptx
Slides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptx
 
Sequência didática Carona 1º Encontro.pptx
Sequência didática Carona 1º Encontro.pptxSequência didática Carona 1º Encontro.pptx
Sequência didática Carona 1º Encontro.pptx
 
Aparatologia na estética - Cavitação, radiofrequência e lipolaser.pdf
Aparatologia na estética - Cavitação, radiofrequência e lipolaser.pdfAparatologia na estética - Cavitação, radiofrequência e lipolaser.pdf
Aparatologia na estética - Cavitação, radiofrequência e lipolaser.pdf
 
Livro infantil: A onda da raiva. pdf-crianças
Livro infantil: A onda da raiva. pdf-criançasLivro infantil: A onda da raiva. pdf-crianças
Livro infantil: A onda da raiva. pdf-crianças
 
EB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptx
EB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptxEB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptx
EB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptx
 
Regulamento do Festival de Teatro Negro - FESTIAFRO 2024 - 10ª edição - CEI...
Regulamento do Festival de Teatro Negro -  FESTIAFRO 2024 - 10ª edição -  CEI...Regulamento do Festival de Teatro Negro -  FESTIAFRO 2024 - 10ª edição -  CEI...
Regulamento do Festival de Teatro Negro - FESTIAFRO 2024 - 10ª edição - CEI...
 
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdfUFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
 
Apresentação sobre Robots e processos educativos
Apresentação sobre Robots e processos educativosApresentação sobre Robots e processos educativos
Apresentação sobre Robots e processos educativos
 
transcrição fonética para aulas de língua
transcrição fonética para aulas de línguatranscrição fonética para aulas de língua
transcrição fonética para aulas de língua
 
Power Point sobre as etapas do Desenvolvimento infantil
Power Point sobre as etapas do Desenvolvimento infantilPower Point sobre as etapas do Desenvolvimento infantil
Power Point sobre as etapas do Desenvolvimento infantil
 
APH- Avaliação de cena , analise geral do ambiente e paciente.
APH- Avaliação de cena , analise geral do ambiente e paciente.APH- Avaliação de cena , analise geral do ambiente e paciente.
APH- Avaliação de cena , analise geral do ambiente e paciente.
 

Bioinformática Apostila de Introdução

  • 1. Universidade Federal do Rio Grande do Norte Centro de Biociências Departamento de Biofísica e Farmacologia Disciplina de Bioinformática Apostila de Introdução a Bioinformática Prof. Alexandre Queiroz Fevereiro de 2002
  • 2. função das proteínas e as interações entre as 1. Biologia e Bioinformática proteínas em um organismo resultando em energia, metabolismo, reprodução e forma. A bioinformática é um campo das ciências biológicas que está em rápido crescimento e está Os genes são as unidades hereditárias dos sendo desenvolvida para atender à necessidade de seres vivos. Sendo assim, a fidelidade das cópias manipular-se com grandes quantidades de dados das informações moleculares contidas nos genes é genéticos e bioquímicos. Estes dados, originados a crucial para a viabilidade dos organismos. Contudo, partir do esforço individual de vários pesquisadores, níveis residuais de mutações são igualmente estão relacionados entre si através de uma origem necessários para sua evolução e enriquecimento comum: as células dos organismos vivos. Para dos conjuntos de genes em populações. A partir da compreender a relação entre estas informações manipulação genética é possível expressar as fragmentadas oriundas das diversas áreas da informações contidas nas seqüências de bases de Biologia (tais como Biologia molecular, bioquímica um ou mais genes e daí se comparar às estrutural, molecular, propriedades esperadas com aquelas apresentadas fisiologia e patologia), a bioinformática usa o poder pelas proteínas em relação à forma e função. A computacional e tecnologia do DNA recombinante pode então ser estruturar estas informações em uma entidade utilizada para sintetizar grandes quantidades de compreensiva e extremamente importante para a proteínas para posterior análise bioquímica e assim Biologia. se confirmar às formas e funções previstas a partir enzimologia, para Estas Biologia catalogar, entidades são organizar reflexões da organização celular da vida e seu denominador das seqüências nos genes. A clonagem, o comum que é a evolução dos seres vivos a partir de sequenciamento e a localização cromossômica são uma forma ancestral comum. 3 aspectos bastante inter-relacionados necessários Devido o fato da bioinformática ser ainda para a compreensão da Biologia molecular de um uma ciência recente ainda não se fez outra gene e seu produto, a proteína. A Biologia definição diferente ou mais precisa. Geralmente ela molecular proporciona a base para a investigação é referida como tendo a tarefa de organizar e do genótipo através da Bioinformática. analisar dados incrivelmente complexos resultantes Durante os primeiros anos do século 20, os de modernas técnicas de Biologia molecular e bioquímicos utilizaram a química orgânica para bioquímica. Para muitos a bioinformática é uma descobrir e montar vias metabólicas, estudar a importante ferramenta para a compreensão de cinética das enzimas e determinar as relações entre como as informações contidas nos genes são estas vias e as doenças hereditárias. Vale ressaltar refletidas em características fisiológicas, como que tudo isto foi realizado sem nenhuma técnica de inteligência, ou Biologia molecular, sem nenhuma informação sobre susceptibilidade ao câncer. De uma forma geral, a a estrutura das proteínas e em muitos casos sequer bioinformática é apresentada como sendo a ciência se sabia que eram os ácidos nucléicos as unidades da criação e manutenção de base de dados (ou hereditárias da vida e não as proteínas. Da mesma Bancos de Dados) e eventualmente a simulação de forma que a química foi útil para os bioquímicos no fenômenos dos organismos vivos. A Bioinformática passado, e a Biologia molecular esta sendo hoje se em baseia crescimento na premissa dos de cabelos que existe um dia, a bioinformática, através dos relacionamento hierárquico entre as estruturas dos conhecimentos gerados a partir das bases de genes, seu arranjo em relação ao genoma, a dados e das simulações também será bastante útil para os biocientistas no futuro. 2
  • 3. homólogos. Por exemplo, na tentativa de curar 2. A Internet e a Publicação científica doenças humanas, muitos genes envolvidos com Não só apenas as mudanças nas técnicas várias vias metabólicas importantes para estas bioquímicas influenciaram na produtividade e no doenças foram estudados em leveduras. Esta sucesso da bioquímica mas, sobretudo, a interação abordagem se fundamenta na relação existente entre os cientistas que através de esforços entre todos os seres vivos baseado na evolução. coletivos ou cooperativos buscaram realmente Assim surge uma nova abordagem da Biologia, a superar o esmagador e ao mesmo tempo tentador genômica comparativa entre espécies lineares. O lançamento do Projeto Genoma Humano trabalho que havia pela frente. Tradicionalmente a o no final dos anos 80 (e muitos projetos genomas de sequenciamento de genes era conduzido por outros organismos) foi um evento decisivo para o cientistas em trabalhos individuais usando uma desenvolvimento da bioinformática. Os biologistas abordagem clone após clone. moleculares que participam do projeto genoma não descoberta de vias metabólicas ou conseguem ir A ampla divulgação das novas descobertas muito longe na pesquisa em e desenvolvimento de novas técnicas envolvem o seqüências livre acesso a informações que estão sob forte técnicas. pressão do poder econômico. Para que o fluxo produzem bits de milhares de pedaços pequenos destas informações seja rápido, a Internet aparece das seqüências de DNA que serão posteriormente como uma ferramenta vital para os cientistas, montados como um gigantesco quebra-cabeças, porque o dando origem a seqüência genômica completa. A de bioinformática é a ferramenta analítica que eles dados precisam para ajudá-los a montar a seqüência ela permite compartilhamento informações de contidas a proliferação grande em e quantidade bancos de lineares inteiras devido a limitações Sendo assim, centralizados. O fluxo de informações científicas genômica e através biológica relacionada da Internet proporciona 3 grandes finalmente eles simplesmente revelar a esta a informação seqüência. A vantagens para os cientistas: primeira, proporciona informação genômica obtida é bastante relevante , o acesso à informação para qualquer um que porque a função de um gene não está apenas na possua um computador conectado a Internet e um seqüência de codificação para uma proteína, mas browser (navegador), sendo esta uma excelente também forma de democratização da informação. Em genomas. Os organismos não usam os genes de segundo lugar, as informações armazenadas em forma isolada, mas sim em grupos. A compreensão bancos apresentam de como o padrão de atividade destes genes é redundância em vários graus. Isto ocorre devido ao controlado durante o ciclo de vida de um organismo fato de que vários pesquisadores podem contribuir ainda está longe de ser totalmente compreendida com a mesma informação para o banco de dados. pelos biologistas. Cada uma das células de um Por conseguinte o acesso a estas informações pela organismo pluricelular contém um pacote completo Internet proporciona um amplo e eficiente controle de genes, mas apenas uma pequena parte é de qualidade para as seqüências armazenadas. Em utilizada pela célula (a maioria dos genes que terceiro lugar, as informações armazenadas nos nunca serão utilizados é inativada). A combinação bancos de dados a respeito de um determinado de genes ativados numa célula define seu destino organismo fornecem valiosas informações que biológico. Isto é conhecido como diferenciação poderão ajudar os cientistas a descobrirem e celular e, normalmente é um processo irreversível compreenderem várias vias metabólicas de outros durante a vida de uma célula. A genômica funcional organismos através da comparação de genes é de dados centralizados 3 uma na organização conseqüência destes direta da genes nos informação
  • 4. acumulada nas seqüências da analisadas por gel de eletroforese bidimensional organização destas dentro do genoma. Através da (proteômica) fornece informações relevantes sobre análise dos padrões de atividade dos genes nas a fisiologia permitindo a detecção de novas e células, tecidos e órgãos, se sabe agora a importantes localização muitas desenvolvimento, com o envelhecimento e com as seqüências relacionadas a importantes questões doenças. Esta informação é fundamentalmente médicas. Devido ao enorme potencial econômico importante destes informação genética é lida e implementada no precisa no achados genômicas genoma de científicos, e como o proteínas para se associadas com compreender como desenvolvimento de novas drogas, os interesses desenvolvimento e no funcionamento comerciais estão fortemente relacionados a estes o a organismo viável. protejo genoma e as brigas pelos direitos de patentes das seqüências de DNA de um Muitos cientistas acreditam que os estudos ainda das seqüências completas obtidas a partir dos desconhecidas tem sido comparada à corrida do modernos projetos de sequenciamento genético, ouro no século 19. irão contribuir muito para uma melhor compreensão da Biologia dos organismos. Outra contribuição importante está relacionada a grande quantidade 3. Genômica e Proteômica de DNA em suas pesquisas de seqüências de Será que o DNA é a única forma de armazenamento de informação que é herdada? Não é tão simples afirmar que toda a informação com o gene. Por outro lado, a abordagem de herdada está unicamente na seqüência de DNA, completos pois devido o fato do mesmo ser incapaz de se produz um acumulo sistemático de seqüências de replicar sozinho fora do ambiente celular, se faz DNA das quais não se tem nenhum conhecimento necessário que, de alguma forma, o DNA seja lido. sobre sua fisiologia e função, pondo a Biologia Na célula esta leitura é feita por proteínas. A molecular de ponta-cabeça. Tradicionalmente os organização cromossômica, a interação e o arranjo cientistas precisavam fazer uma varredura de dos complexos DNA/proteínas também são parte linhagens inteiras de células ou tecidos animais da informação herdada, não apenas a seqüência do para identificar um novo gene (através da técnica DNA. Os banco de dados estão se expandindo de Northern Blot). Agora eles podem fazer essa muito varredura eletronicamente nos banco de dados sequenciamento de de proteínas mRNA que acomodar são dados atualizados novos e abril de 1988 até o final de 1999 os projetos gerou um excelente atalho em relação ao método isolamento para alguns disponibiliza-los para a comunidade científica. De fragmentos de genes (Northen eletrônico). Isto de rapidamente, diariamente públicos para a descoberta de novos genes ou tradicional muitos genoma é a compreensão da vida! traz consigo a informação sobre a função associada genomas em sentido desta descoberta. A promessa dos projetos genes vantagem da abordagem gene a gene é que ela já maciçamente codificado futuro, o caminho a ser seguido pelos cientistas no distribuídos em vários bancos de dados públicos. A sequenciar é conhecimento destas seqüências irá indicar, no da Biologia celular e bioquímica resultou em uma aleatória não desconhecido e não se sabia sua função. O nas universidades com interesse em diversos aspectos coleção que organismos. Este DNA, até bem pouco tempo era O esforço dos biólogos moleculares para sequenciar DNA genoma cobriram 83 espécies com e completados eram 21 projetos (predominantemente microorganismos) e no ano 2000 existiam 62 necessários para se obter às seqüências de DNA. projetos em andamento. Estes projetos genoma A sistemática de detecção e anotação de proteínas 4
  • 5. são realizados através da clonagem automática por 4. Computação em Biologia e Medicina PCR (polimerase chain reaction) ou reação em cadeia da polimerase, que amplifica o DNA e pelos A bioinformática utiliza como ferramentas a sistemas de sequenciamento automático. Para a matemática aplicada e a computação. A Biologia reconstrução dos espaços vazios (gap-free) e união molecular de hoje seria impossível sem os recursos das seqüências contíguas (contigs) oriundas da de bioinformática, tais como o armazenamento, fragmentação aleatória dos cromossomos (shot- distribuição e atualização das informações, as gun) são utilizados softwares especiais que, análises estatísticas, a modelagem de dados e a realizam esta função em toda a seqüência do simulação genoma base por base. diferentes países. Hoje de a impossíveis sem os inserção de sondas miniaturizadas no interior de Internet, e aos projetos genoma que impulsionam o vasos e na realização de delicadas técnicas de incrível aperfeiçoamento das técnicas de clonagem microcirurgias. A neurobiologia está começando a e sequenciamento. Atualmente, a ciência tem sido, negócio seriam ajudar os médicos em seus diagnósticos, como na bancos de dados centralizados, a comunicação via excelente laboratório equipamentos analíticos e a realidade virtual para ciência independente graças ao advento dos um em computadores. A medicina moderna utiliza muitos bioinformática está sendo transformada em uma considerada biológicos neurobiologia e o uso de sofisticados equipamentos uma colaboração entre diferentes grupos de em fenômenos computador. Pesquisas e tratamentos médicos, Inicialmente, a bioinformática havia sido pesquisas de mapear a anatomia cerebral e a composição e, celular, assim como os projetos genoma estão conseqüentemente, muitas organizações públicas mapeando os cromossomos. A neuroinformática e privadas têm sido fundadas com o objetivo de também é um novo e emergente ramo da sequenciar genomas completos, mapear todos os bioinformática. Ela surgiu através do esforço genes e criar bancos de dados que relacionem às colaborativo entre neurologistas, (cientistas que seqüências com a estrutura e função celular. estudam cognição) e psicólogos. O cérebro e os neurônios estão sendo encarados como um sistema complexo que serve de modelo para o desenvolvimento de redes neurais de computadores, devido à forma com que os neurônios trabalham. Algoritmos genéticos e raciocínio não linear atualmente têm sido utilizados para o desenvolvimento de inteligência artificial e evolução computacional. (Veja: The Genetic Algorithms Archive – um arquivo mantido por Alan C. Shultz no Centro para pesquisa aplicada em Inteligência artificial http://www.aic.nrl.navy.mil/galist/). 5 –
  • 6. segundos, a facilidade de se mudar o layout do 5. Algoritmos Computacionais texto e das figuras tem aumentando em grande quantidade o desperdício de papel, simplesmente Os computadores são essenciais para o porque nós ainda queremos ver como vai ficar o processamento de grandes quantidades de dados produto final! Por outro lado às várias cópias em tempo hábil para seu estudo. Contudo, os produzidas das várias versões de um texto podem computadores precisam de instruções, processo ser economizadas pelas versões eletrônicas vistas chamado de intervenção humana. Este processo de no próprio monitor. Corretores ortográficos e instrução analítica humana pode demandar muito gramaticais são bons exemplos de um simples tempo para resolver um problema usando o algoritmo que pode fazer uma medida analítica da computador. Atualmente muitos dos processos linguagem. Uma das armadilhas dos corretores automatizados têm como objetivo ensinar os computadores a tomarem decisões ortográficos está na leitura de uma determinada num palavra dentro de um contexto, o computador não determinado futuro (como o reconhecimento do pode encontrar um erro ortográfico se a palavra contexto de um problema). Sistemas inteligentes estiver correta para um outro contexto (por são programas que realizam determinadas tarefas exemplo: conserto e concerto). A habilidade da que requerem enorme poder computacional. As mente situações da vida real nunca são totalmente decisões baseadas atualmente em analisar e reconhecer corretamente, falas, estilos e gramática não é reprodutíveis para os computadores comuns e muitas humana reproduzida satisfatoriamente pelos computadores na porque intervenção humana estão sendo projetadas para mentes e computadores trabalham diferentemente. O funcionamento da correção serem manipuladas por redes neurais (Neural ortográfica é muito parecido com a análise de Networks –NNs) que são sistemas que possuem a dados científicos e sua subseqüente interpretação habilidade de aprender. As redes neurais embora quando feito pelos computadores, mas apenas sob sejam uma boa promessa para o futuro, ainda são o restrito controle da mente humana. difíceis de se aplicar de forma bem sucedida em Os problemas relativos a manipulação de símbolos e computadores são excelentes ferramentas para soluções numéricas (análises e memória. Além disso não existe um método de simulações), controle de máquinas, edição e busca treinamento de NNs que permita, de forma mágica, de caracteres em textos, busca de relação entre que elas criem alguma informação que não esteja dados e gerenciamento de base de dados. As contida nos dados previamente informados (Neural ultimas Network FAQ; ftp://ftp.sas.com/pub/neural/FAQ.html três aplicações bioinformática. ). Alguns algoritmos podem ser desenvolvidos para funcionarem de forma eficiente em computadores que respondem questões repetitivas onde os dados informados e obtidos variam constantemente e podem ser gerados e ajustados pelo próprio processo como num feedback. O poder dos computadores é inegável. A facilidade de se escrever um texto em um processador de texto, por exemplo, se tornou uma ferramenta tão popular que hoje em dia pode ser considerada indispensável. Embora a formatação de um texto possa ser feita em questão de 6 são cruciais para a
  • 7. 6. Diferentes tipos de computadores de diferentes comprimentos de onda, incluindo para diferentes tarefas medidas em tempo real para o monitoramento de mudanças na composição química de soluções. Os cromatógrafos fazem a separação de misturas Os computadores pessoais (PCs) são moleculares como componentes individuais de multifacetados e são usados para várias tarefas acordo com seu tamanho e solubilidade. Estes como processamento de texto, planilhas de cálculo, equipamentos apresentações e acesso a Internet. Com softwares especializados também podem Instruments software (http://www.axon.com/) aplicativo largamente usado para dinheiro ou efetua o pagamento de uma conta, mas você não pode editar um texto ou alterar o programa. e alinhamento de múltiplas seqüências de DNA da existência de supercomputadores. Os laboratórios podem ser equipados com várias opções de interfaces com PCs que ajudam nas pesquisas em que atendam as necessidades específicas dos experimentos. Estima-se que apenas 1% de todos os microprocessadores no mundo estejam nos PCs. Os outros 99% estão envolvidos em muitos outros produtos espalhados pelo mundo, como aeronaves, sistemas de refrigeração e aquecimento, instrumentos de laboratório, sistemas de segurança e outros dispositivos. Estes processadores são comumente referidos como “firmware”, que são chips que tem como função especial realizar tarefas sem a necessidade de programação. A ciência requer o uso de os computador que realiza a transferência de seu dos PCs em redes locais, têm guiado os cientistas aplicações geral acessar sua conta bancária, você interage com o velocidade e o aumento do poder computacional independentemente Em para onde um pequeno teclado pode ser usado para movimento (ex.: Mal de Parkinson). A versatilidade, molecular) interfaces funcionam essencialmente como caixas eletrônicos, diagnóstico e monitoramento de distúrbios do (evolução remotos. com digitado ou selecionado a partir de um menu. Eles microeletrodos em neurocirurgia funcional e no molecular porém de código ou comando de texto que pode ser hibridização de fragmentos de DNA, para guiar modelagem fim, pequenas telas que mostram uma ou mais linhas concentração de íons, para analisar os padrões de com por microprocessadores são acessíveis através de em atividade elétrica em neurônios, na medida da trabalho este computadores um eletrofisiologia para o controle e medida da no controlados microprocessadores construídos especificamente controlar equipamentos de laboratório como o pClamp da Axon são muitos equipamentos que usam processadores, como cromatógrafos a gás, balanças computadorizadas e espectrofotômetros. Os espectrofotômetros são usados para ler o espectro de absorção luminosa 7
  • 8. Finalmente, a Internet é uma rede de 7. Supercomputadores supercomputadores e estações de trabalho (PCs) conectados através de switches, roteadores e Os supercomputadores são usados para tarefas que computacional demandem e cabos de fibra óptica. A grande força da Internet é o poder necessitem que grande grande modo interativo remoto. A maior parte dos capacidade de armazenamento e memória. Eles aplicativos disponíveis na World Wide Web (www) são os servidores principais dos provedores de roda Internet dispensando a necessidade de downloads de e a maior parte utiliza o sistema através de supercomputadores remotos sido softwares para análise local. A bioinformática é um implementado em muitas comunidades científicas exemplo de que a Internet tem sido parte integral devido a sua alta capacidade e baixo preço. da pesquisa científica e que sua necessidade e uso operacional UNIX. Este sistema tem através de programas remotos se tornaram cada Em 20 de junho de 1997 pesquisadores do vez mais importante. centro de supercomputadores de Pittsburgh Nos Estados Unidos e a Universidade de Stuttgart na Alemanha conectaram supercomputadores dos dois 8. Limitações na análise computacional lados do atlântico via rede de pesquisas de alta – A promessa paradoxal da Internet. velocidade. Esta foi a primeira vez em uma rede de telecomunicação de alta velocidade (Very High Speed Backbone Network Service – vBNS) para Quando um experimento é terminado, os transmissão de dados de computador através do dados acumulados precisam ser analisados ou atlântico. Considerado como protótipo para a rede processados. Isto inclui a tabulação de bases de internacional de alta performance, um projeto dados, colaborativo entre o processador CRAY T3E com correlacionais e, o mais importante de todos, a outro processador de alta performance de Stuttgart. seleção dos dados que podem ser analisados e O trabalho de computação realizado por dois utilizados para interpretação dos fenômenos. Este supercomputadores de último é um processo que é independente do trabalho e conectados entre si é conhecido como computador e evidentemente dependa da confiança “metacomputação”. O link Pittsburgh-Stuttgart criou do cientista em seus experimentos. O julgamento um sistema virtual de 1024 processadores com a da qualidade dos dados pode enganar aos olhos do performance teórica de 675 bilhões de cálculos por observador, uma vez que o que se espera ver está segundo! O projeto permitiu o desenvolvimento de baseado na hipótese na qual os experimentos várias redes de pesquisas através da conexão de foram fundamentados. em diferentes locais realização de testes estatísticos ou alta velocidade entre os dois centros através do A intuição e a interferência dos cientistas atlântico. Cada nova rede estabelecida nos últimos são os fatores mais importantes na tomada de anos permitiu a transmissão de informações a uma decisões corretas. É claro que os computadores velocidade 100 vezes mais rápida que a Internet podem ajudar, mas apenas com softwares que convencional. Por exemplo, o vBNS que conecta os tenham sido desenvolvidos especificamente para centro de supercomputadores dos Estados Unidos, aquela análise, ou seja através da intervenção atualmente pode transmitir em velocidades em humana. Enquanto que o processo analítico pode trono de 622 milhões de bits por segundo, ser feito exclusivamente por computadores, a velocidade interpretação dos dados não pode ser feita por um suficiente para transferir toda a computador por si só. Contudo, computadores Enciclopédia Britânica em menos de 10 segundos. podem ajudar a análise de dados avaliando cada 8
  • 9. variável de um experimento e lendo os dados de produziram forma mais consistente, o que não poderia ser função biológica associada. Obviamente esse era observado superficialmente pelo cientista. seu objetivo. Espera-se que se possam extrair muitas seqüências sem nenhuma Nenhum manual técnico, livro ou a Internet informações ordenadas de modo a orientar novos podem sobrepor a experiência. O estudo e o ganho experimentos que colaborem para desvendar a de experiência são os fatores mais importantes Biologia por trás destas seqüências. neste estágio do processo científico.É aqui que a Internet oferece uma importante ajuda para os 9. cientistas. Contudo, as informações encontradas computacionais em livros texto, páginas com instruções causar impressão aspectos da vida. As neurociências concentram-se na Biologia dos neurônios. A bioquímica se detém um livro em uma biblioteca ou realizar um curso na química dos organismos vivos. A Biologia tradicional de longa distância. A razão de insistir molecular estuda as interações biológicas em nível neste ponto é que saibamos que a precisão dos molecular e suas interferências para as células e dados gerados por computador depende do quanto são manuseadas as pelo informações operador fornecidas humano. para o organismo como um todo. A virologia e a e Não bacteriologia concentram-se nos ciclos de vidas de é vírus e de bactérias, respectivamente. Muitos nenhum segredo que as bases de dados de DNA e outros aspectos da Biologia se concentram em proteínas contém erros conseqüentes da origem e tópicos específicos da Biologia que são importantes da forma com que as seqüências foram obtidas. O sucesso da bioinformática está para cada campo particular. É indiscutível a diretamente importância que cada um destes aspectos da vinculado a uma anotação completa e confiável das Biologia seqüências nas bases de dados e com a precisão de informação, para o outro. A grande se tornando mais obvia com o avanço nas não será por muito tempo. Para tornar as bases de confiáveis ter fornecidas por cada um destes campos agora está de precisão das anotações não é automatizado e fontes pode sobreposição de dados que existe nas informações dos dados biológicos. Este processo de checagem dados Ferramentas campos multifacetados concentrando um ou mais contrária. Atualmente a Internet não é mais interativa que ler correto de Atualmente a Biologia e a medicina são experiência prática, embora a natureza interativa da possa necessidade e protocolos de laboratório não são substitutos para a Internet A ferramentas são de conseqüentemente, necessários muitos especialistas para analisar manipulação de dados e, necessita do uso de ferramentas computacionais mais elaboradas. palavra por palavra. O incrível avanço na Biologia e na medicina A comparação de seqüências de genes durante as últimas décadas tem criado um usando programas como o BLAST é razoavelmente feedback positivo, onde cada novo achado serve fácil, mas a compreensão verdadeira do que os como guia para o crescimento e popularidade de resultados desta comparação significam pode ser um determinado campo da Biologia. Isto também extremamente difícil. Os resultados dependem dos gera um crescimento exponencial dos dados tipos de seqüências comparadas e da origem biológicos. Desta forma também se faz necessário destas seqüências. Ou seja é necessário se um poderoso e eficiente sistema de manipulação de compreender a Biologia por trás da seqüência que dados biológicos, o que parece óbvio, mas sem o está armazenada na base de dados e por poder dos computadores isto seria inimaginável. Os comparação chegar a alguma conclusão a respeito computadores são agora parte integrante do mundo das novas seqüências. Os projetos genomas biológico e sem eles, os atuais avanços na Biologia 9
  • 10. e na medicina seriam, sem dúvida, impossíveis. A demais em um sistema biológico. A simples parceria vivas separação de moléculas em categorias específicas (computadores) e a Biologia criou a necessidade de não é o suficiente. Os sistemas de gerenciamento se fundir certos aspectos destas duas ciências. de dados devem ser capazes de mostrar a relação Novos campos, como a ciência da computação em existente nas informações contidas nas moléculas medicina, de interesse. As informações em um arquivo entre a estas criaturas bioengenharia não e a Biologia computacional estão em franca ascensão e estão específico ganhando grande respeito dentro das ciências da relacionados em outros sites relevantes. Por vida. O objetivo destes campos é a rápida análise exemplo, no sumário do arquivo PDB da mioglobina de dados biológicos e a descoberta de informações de cavalo devem existir várias opções de links para biológicas várias informações relacionadas à molécula da podem desconhecidas. ser ferramentas Estas úteis informações em avanços devem conter links para dados mioglobina. Estas informações relativas a um terapêuticos no prolongamento e melhoramento da determinado qualidade de vida. informações potencialmente úteis sobre outras dado permite-nos avaliar outras A introdução da Internet na Biologia foi um bastante fato moléculas em outros sistemas e em outros servidores na Internet. positivo, dramaticamente a tem comunicação aumentado entre os pesquisadores e reduzido a repetição de trabalhos em várias áreas da pesquisa científica em todo o mundo. A existência de sistemas gerenciadores de dados como o National Center for Biotechnology Information (NCBI - http://www.ncbi.nlm.nih.gov) e o European Bioinformatics Institute (EBI - http://www.ebi.ac.uk/ ) tem aumentado a eficiência de muitos pesquisadores em todo o mundo e unindo cientistas oriundos de diferentes disciplinas. O crescimento exponencial dos dados biológicos requer uma organização específica nas bases de dados através de sistemas especializados para cada tipo de informação. Por exemplo, os dados biológicos pertinentes às proteínas precisam ser separados dos polinucleotídeos (DNA e RNA). Os bancos de dados de proteínas (PDB – Protein Data Bank) são exemplos de sistema onde os dados das proteínas são armazenados especificamente como estruturas protéicas. Assim como muitos outros bancos de dados biológicos, o PDB permite a comparação entre diversas moléculas estocadas. No PDB, estas informações podem ser obtidas a partir da classificação estrutural das proteínas. Base de dados como o SCOP (Structural classification of Proteins) são ferramentas úteis na caracterização de macromoléculas em relação as 10
  • 11. 10. Novas descobertas em Pesquisa científica com computadores Problemas biológicos ainda sem solução são agora os principais temas da Biologia computacional no mundo. A Bioquímica, a Biofísica, a Biologia molecular, a Biologia evolucionária, a Bioinformática, as neurociências e a Farmacologia são apenas alguns dos campos das ciências naturais que têm sido significativamente influenciados pelas ferramentas computacionais. Ao contrário dos fenômenos da física, os fenômenos biológicos, até recentemente, eram considerados imprevisíveis e muitos dos seus aspectos eram considerados ferramentas reduzido indescritíveis. computacionais brutalmente os A introdução de Biologia tem na problemas com o manuseio de dados e mais importante que isso, tem permitido a observação da relação existente entre as moléculas biológicas em seus respectivos campos da Biologia. As novas informações biológicas aliadas com o aumento da nossa habilidade em prever fenômenos biológicos têm reforçado muito o avanço da Biologia. A idéia da Biologia como uma ciência previsível é um estímulo para muitos cientistas, o que tem afastado a visão das ciências biológicas como ficção científica. A sociedade como um todo tem dedicado grande atenção à Biologia e a Medicina nas últimas décadas graças aos avanços ocorridos como a introdução de novas drogas e tratamentos que prolongam e aumentam a qualidade de vida. Estas novidades tem sido instrumento para colocar vários campos da Biologia, como a Bioquímica e a Biologia Molecular no pedestal da ciência Adaptado de Bioinformatic Basics – Applications in Biological Science and Medicine. Hooman H. Rashidi e Buehle. CRC EUA 2000. 11