SlideShare uma empresa Scribd logo
1 de 11
Baixar para ler offline
Bioinformática
Bruno Ferreira Rezende, Diogo Santos da Silva
Universidade Federal de Mato Grosso - Campus Universitário de Rondonópolis
Instituto de Ciências Exatas e Naturais - Curso de Licenciatura em Informática
Disciplina de Inteligência Artificial - Professora Soraia Silva Prietch
Rondonópolis – MT – Brasil
{brunofr84, diogo83}@gmail.com
Resumo. Este trabalho fala sobre o começo da bioinformática e o seu
relacionamento com outras áreas. Cita algumas características particulares
que mostra sua importância para a colaboração do melhoramento e
desenvolvimento de novas técnicas de pesquisa em bancos de dados e
inteligência artificial onde são aplicadas técnicas padrões, mas que em sua
maioria foram criadas para atender pequena quantidade de dados o que
difere das grandes quantidades de informação, devendo assim ser adaptadas
para tal função. A importância da análise e manipulação dos dados antes de
serem armazenados. Comentaremos também alguns projetos brasileiros e
como funciona a integração de bancos de dados genômicos.
Abstract. This work is about the beggining of bioinformatics and its
relationship to other areas. Quote some particular characteristics that shows
its importance to the cooperation of the improvement and development of new
techniques in search of databases and artificial intelligence where technical
standards are applied, but most of them were created to serve small amount of
data which differs from large amounts of information and should therefore be
adapted for this function. The importance of analysis and manipulation of data
before being stored. We will comment also some Brazilian projects and how
the integration of genomic data banks.
1. Introdução
Com a realização de pesquisas envolvendo geneticistas e químicos surgiu à conclusão
que o DNA era a molécula que armazenava a informação genética, em 1953, sua
estrutura ficou conhecida pelo trabalho desenvolvido por Watson e Crick.
Posteriormente surgiram métodos de seqüenciamento dos polímeros do DNA,
permitindo o estudo das formas mais simples que o constitui.
Por volta da década de 90, começaram a surgir seqüenciadores automáticos de
DNA aumentando consideravelmente a quantidade de seqüências genéticas a serem
armazenadas conseqüentemente exigindo cada vez mais recursos computacionais como
armazenamento e interpretação dos resultados obtidos, surgia assim à bioinformática
[Filho 2002].
Essa nova ciência segundo Filho (2002) envolve diversas áreas do
conhecimento, tais como a engenharia de softwares, a matemática, a estatística, a
ciência da computação, biologia molecular, etc.
A dificuldade de comunicação dos profissionais dessas diferentes áreas criou a
necessidade de um novo profissional que possuísse conhecimento para fazer a ligação
dessas ciências o Bioinformata [Filho 2002, Silva 2003].
Como na evolução da genética também houve a evolução da informática o que
fez com que surgissem diferentes áreas de estudo e técnicas. Foram criados inúmeros
grupos de pesquisas para serem usadas na bioinformática nas mais variadas aplicações
como: Simulação em ambientes virtuais de organismos semelhantes aos reais analisando
o seu comportamento e obtendo resultados antes só adquiridos através de testes feitos
com organismos reais. Simulação citada no projeto ALIVE de Neves e Neto (2003);
Projeto Alga de Marques e Neto (2002), que busca através de um ambiente virtual
simular o comportamento de uma alga especifica frente a várias condições climáticas e
outros fatores. Tem muitos outros projetos e grupos de estudo foram citados esses dois
como exemplos.
A inteligência artificial tem um importante papel na bioinformática, como em
redes neurais onde através de algoritmos genéticos busca a melhor solução para um
problema especifico como é o caso do projeto WOXBOT de Miranda (2004) onde faz a
seleção de personagens mais bem adaptados em um ambiente virtual. Auxilia também
na análise de dados como cita Costa (2003), que a inteligência artificial tem evoluído
proporcionando análises cada vez mais completas dos demais dados biológicos.
1.1. Justificativa
O estudo do seqüenciamento genético foi o grande propulsor da bioinformática, surgiu
da necessidade da integração de varias ciências dentre elas a informática que
desempenha função fundamental nessa ciência. A bioinformática se torna de grande
importância para a ciência, pois através dela segundo Leal (2002) pode-se construir base
de dados contendo informações dos genes e proteínas dos organismos vivos, podendo
ocorrer à descoberta de novos genes e medicamentos. Na bioinformática são utilizadas
técnicas de inteligência artificial para tanto fazer a analises de dados quanto tomadas de
decisões segundo Costa (2003) e Miranda (2004).
1.2. Objetivos
Este trabalho tem como objetivo principal descrever o surgimento da Bioinformática e
posteriormente destacar sua importância para a biologia molecular bem como algumas
influências da Inteligência Artificial exerce sobre alguns trabalhos desenvolvidos nessa
nova ciência. E por final descrever algumas aplicações das técnicas utilizadas na
computação na bioinformática expondo o objetivo de alguns trabalhos já realizados
2. Metodologia de Pesquisa
Este trabalho tem como objetivo uma pesquisa sobre a bioinformática utilizando de
meios como um livro referente a métodos utilizados na área referida e também artigos
encontrados de forma digital.
3. Revisão de literatura
Segundo Arbex (2006), a bioinformática teve como fator para o seu fortalecimento o
projeto Genoma, visto que a necessidade de um sistema de computação que
armazenasse e analisasse as enormes quantidades de dados gerados por esse projeto se
torna imprescindível e exige cada vez mais da área da computação.
Essa nova ciência é interdisciplinar promovendo a interação de profissionais de
diversas áreas do conhecimento conforme diz a AB3C (Associação Brasileira de
Bioinformática e Biologia Computacional) e Filho (2002) exemplifica essas áreas como
sendo de engenharia de softwares, a matemática, a estatística, a ciência da computação e
a biologia molecular.
Segundo Arbex (2006), há a necessidade de sistemas computacionais de grande
porte bem profissionais especializados para a manipulação do mesmo. Com isso surge
um novo profissional o Bioinformata.
O Bioinformata falando de forma resumida segundo Soares (2006) utiliza a
computação como meio de resolver problemas biológicos.
Assim conforme afirma Arbex (2006) esse profissional precisa ter conhecimento
sobre:
• Biologia molecular, para, no mínimo, entender o problema;
• Matemática e probabilidade, de forma que fosse capaz de estabelecer um
modelo de representação do problema;
• Computação, possibilitando a implementação da solução correta e
apropriada, sendo esta inicialmente conhecida ou não;
• Estatística, para que as soluções fossem comprovadamente confiáveis.
Segundo Filho (2002) esse profissional deve ter conhecimento sobre os
problemas biológicos reais e através de meios computacionais tentar resolver o referido
problema.
Assim são utilizadas varias técnicas computacionais para ensinar as máquinas
que serão utilizadas na bioinformática como redes neurais artificiais, máquinas de
vetores suporte, árvores de decisão, algoritmos genéticos, algoritmos de agrupamento,
cadeias escondidas de Markov (HMMs) conforme citado no site Mundo Educação.
Apesar de a bioinformática ter surgido como afirma Arbex (2006) com o projeto
Genoma, o que deu seus primeiros passos nos EUA criado por setores privados e
posteriormente passou a ser alvo internacional pela sua perspectiva financeira se
espalhando por vários países inclusive o Brasil [Algosobre].
3.1. Bioinformática no Brasil
Segundo Gerhardt (2001) a bioinformática teve seu pioneirismo com a vinda de Neshich
de origem sérvia, onde foi o idealizador do projeto BBNet (BrazilianBioNet), uma rede
de usuários da bioinformática, formada em 1992, que propiciou os primeiros contatos de
cientistas brasileiros a programas de análise de seqüência de DNA de forma gratuita, por
intermédio de um computador (servidor) da Embrapa Recursos Genéticos e
Biotecnologia.
Depois desse projeto surgiram muitos outros como também a construção de
núcleos especializados que realiza trabalhos específicos como traz a matéria de Levy
(2002) onde divulga a construção do NBI (Núcleo de Bioinformática), um sofistica
laboratório construído no prédio da UNICAMP. Que por meio de simulações feitas
através de um software nacional, chamado de Sting, em computadores, permitirá o
estudo do genoma estrutural e genoma funcional.
Foi criada também uma a AB3C (Associação Brasileira de Bioinformática e
Biologia Computacional) que tem por objetivo promover a interação de vários
especialistas de áreas relevantes como biologia, medicina, ciência da computação, etc.
A bioinformática tem no Brasil vários projetos associados a grupos de estudos
com objetivo em comum para tentar solucionar um problema específico como citado
pelo Departamento de Engenharia de Sistemas Eletrônicos - PSI/EPUSP onde há 5
grupos onde cada um busca uma solução para um problema específico [Miranda 2004,
Marques 2002 e Neves 2003].
Outro programa criado que promoveu a disseminação da bioinformática no
Brasil foi a rede Onsa (sigla, em inglês, para Organization for Nucleotide Sequencing
and Analysis) essa rede permitia o estudo virtual e dinâmico com as instituição
associadas. Vários centros de pesquisa foram criados a partir dessa rede espalhando por
diversas instituições em diversos estados brasileiros como na Unicamp, na USP, na
Unesp, no Instituto Ludwig, no Laboratório Nacional de Computação Científica, no Rio
de Janeiro, na Universidade Federal de Pernambuco, na Federal de Minas Gerais e na
Federal do Rio Grande do Sul [Vogt 2003].
E uma das provas que o Brasil esta se destacando na Bioinformática no cenário
Internacional foi à realização do Congresso Internacional de Bioinformática segundo a
Embrapa (2006) em 2006 foi em Fortaleza e segundo MAPA (2007) em 2007 foi em
São Paulo.
Esse encontro promove a interação entre diversas comunidades cientificas na
área de biologia computacional e também estudantes onde podem trocar idéias e
aperfeiçoar seus trabalhos [Embrapa 2006].
3.2. Técnicas Utilizadas na Bioinformática
Segundo o Mundo Educação são utilizadas técnicas de inteligência artificial no ensino
do computador que será utilizado na bioinformática como redes neurais artificiais,
máquinas de vetores suporte, árvores de decisão, algoritmos genéticos, algoritmos de
agrupamento, cadeias escondidas de Markov (HMMs).
De acordo com Russell (2004) será apresentada uma breve explicação do que
consistem algumas técnicas de Inteligência Artificial que são utilizadas em
bioinformática como:
• Redes Neurais: são funções não-lineares complexas com muitos
parâmetros. Seus parâmetros podem ser aprendidos a partir de dados
ruidosos, e elas são usadas em milhares de aplicações;
• Máquinas de Vetores de Suporte: utiliza algoritmos de treinamento
eficiente e podem representar funções complexas não-lineares;
• Cadeias Escondidas de Makov: fornece uma estimativa razoáveis das
probabilidades posteriores verdadeiras em uma rede e podem lidar com
redes muitos maiores do que os algoritmos exatos;
• Árvores de Decisão: podem representar todas as funções booleanas. Uma
árvore de decisão alcança sua decisão executando uma seqüência de
testes.
• Algoritmos Genéticos: é uma forma de busca aleatória onde os
sucessores são gerados a partir de dois estados pais, em vez de serem
gerados modificados de um único estado.
• Algoritmos de Agrupamento: faz os agrupamentos de dados de padrões
4. Aplicação
O elevado número de informações geradas todos os dias pelo mapeamento de genes
necessitam ser armazenadas de forma sistemática em bancos de dados computacionais,
servindo de base para estudos médicos e biológicos através da Bioinformática [Leal,
2008].
Segundo Silva (2004) essa elevada quantidade de informações precisa ser
cuidadosamente decifrada e com a organização e decodificação, podem-se encontrar
informações muito valiosas sobre os mecanismos biológicos.
Para isso, é necessária uma adaptação dos Sistemas Gerenciadores de Banco de
Dados para poderem suportar os dados gênicos (de genoma), a fim de se fazer um
armazenamento e busca destes dados da maneira mais excelente possível [Leal].
Ainda segundo Leal (2003), a maioria dos bancos de dados biológicos, consiste
em longas cadeias de caracteres para representar as bases do DNA. OS bancos de dados
normalmente são usados para fins administrativos, e poucos possuem a capacidade de
lidar com dados complexos, como dados multimídia ou dados genéticos (sucessão de
genes).
Uma das metas da Bioinformática é agilizar a busca dessas informações,
localizando sinais prováveis de genes e produtos de genes de seqüências de DNA ainda
não caracterizadas experimentalmente. Mas para isso não basta apenas os conceitos de
métodos rápidos de busca, é preciso uma base biológica para compreensão das
informações a serem relacionadas e extraídas [Silva].
Leal (2003) descreve que para revolver este problema, deve ser feita uma
padronização de tipos de dados e métodos que os bancos de dados devem suportar,
relacionando-os e descrevendo suas funcionalidades. Surge assim necessidade de se
possuir diferenciadas formas de armazenamento, tratamento, acesso e pesquisa dos
dados, para que se consiga trazer a informação da melhor maneira desejada possível.
A primeira medida a ser tomada é adotar Sistemas Gerenciadores de Banco de
Dados com suporte para a criação de novos tipos de dados e métodos. Este banco de
dados extensível dará o apoio necessário às necessidades do sistema para definir novos
tipos de dados que sejam capazes de: criar entidades de domínio como sucessão
genotípica; fazer uso de operadores definidos pelo usuário; criar indexação de domínio
específico, fornecendo apoio para índices específicos de dados biológicos e otimizar a
extensibilidade, fazendo assim uma ordenação inteligente dos predicados em questão,
envolvendo tipos de dados definidos pelo usuário [Leal, 2003].
Depois disto, adotar sistemas envolvendo Data Warehouses (Armazéns de
Dados), pois estes são constituídos tipicamente de 5 camadas: as fontes de dados, que
contém os dados a serem integrados ao Data Warehouse através dos Wrapper’s
(analisadores gramaticais de dados), os mediadores (que traduzem os dados para a
representação do Data Warehouse), o próprio Data Warehouse, que é um grande
repositório de dados, geralmente um banco de dados relacional, que possui uma visão
consistente dos dados provenientes das fontes de dados, e finalmente os usuários, que
interagem com o sistema através de uma interface. Características presentes Oracle SQL
Server [Leal, 2003]
Segundo Critchlow, o desafio para a criação de um Data Warehouse para o
ambiente da bioinformática está no fato de que se deve desenvolver uma infra-estrutura
flexível o bastante para controlar a natureza dinâmica do domínio, pois fontes de dados
para aplicações científicas são extremamente dinâmicas. Sempre que uma fonte de
dados muda seus dados, o Wrapper e o mediador devem ser atualizados para que estas
atualizações sejam espelhadas no Data Warehouse.
Uma terceira abordagem é a utilização de bases de dados XML, pois através da
construção de documentos de definição XML permite fazer conversões entre bancos de
dados que se utilizam de diferentes tecnologias de XML. A grande preocupação neste
caso é de como integrar as diversas bases de dados XML, já que os dados biológicos não
possuem uma estrutura padrão, pois os dados podem variar de tipo de uma base para
outra [Leal, 2003].
Um outro ponto a ser tratado são os Bancos de Dados Públicos sobre
Bioinformática. São BDs envolvendo seqüencial de nucleotídeos, aminoácidos ou
estruturas de proteínas cada uma delas podendo ser classificadas em bancos de
seqüências primárias ou secundárias.
Os primários são formados pela disposição direta das seqüências de
nucleotídeos, aminoácidos ou estruturas protéicas sem qualquer processamento ou
análise. Dentre os principais temos: GenBank, EBI (European Bioinformatics Bank),
DDBJ (DNA Data Bank of Japan). Estes bancos são membros do INSDC (International
Nucleotide Se-quenceDatabase Colaboration) onde cada um deles permite a submissão
individual de seqüências de DNA e trocam informações diárias entre si.
Já os bancos secundários são derivados dos primários. Eles contêm informações
contidas nos bancos primários, mas que, por exemplo, foram coletadas informações de
seqüências protéicas e associadas a informações sobre função, domínios funcionais,
proteínas homólogas e outros.
Quanto à aplicação da Inteligência Artificial na Bioinformática, encontramos
exemplos como o da Lusa Universidade do Minho onde existem estudos para fazer a
leitura e o armazenamento em bases de dados de estruturas genéticas como o ADN ou o
genoma humano ainda testar a possibilidade de melhoria de métodos de análise
multidimensional de bases de dados [Lusa].
Segundo Pedro Henriques "A aplicação da inteligência artificial, em bases de
dados com vários milhões de registros, simplifica as conclusões sobre hábitos de
consumo, sazonalidade, entre outros, o que é de grande valia para a tomada de
decisões".
Seguindo essa analogia encontramos na revista Reciis sobre Biomarcadores e a
Proteômica sobre A identificação de painéis de biomarcadores, esta técnica desafia o
campo da prote-ômica exigindo cada vez mais sensibilidade e poder de quantificação
que os das técnicas existentes. Este problema atinge também a Inteligência Artificial no
setor de reconhecimento de padrões. Onde maior parte dos dados obtidos são limitados
devido ao baixo número de amostras disponíveis para pesquisa. “Outros fatores
limitantes são: o custo dos equipamentos e reagentes, o elevado número de parâmetros
por amostra, grande variabilidade entre amostras de mesma classe, limitações na
reprodutibilidade das técnicas proteômicas para detecção e quantificação simultânea de
milhares de proteínas, e a falta de conhecimento de uma função de densidade de
probabilidade que descreva adequadamente a variação do nível de expressão de cada
proteína para o caso em estudo.”
Para tornar eficientes as buscas e análises de bancos de dados podem ser
utilizadas técnicas de inteligência Artificial e sistemas desenvolvidos para realizar
mineração e analises de dados em problemas no qual pretende se obter uma solução,
como foi o caso da Joana S. de P. Gonçalves (2007), ganhadora do Prêmio Nacional de
Trabalhos de Licenciatura, atribuído pela associação portuguesa para inteligência
artificial, que desenvolveu o sistema BiGGEsTS.
Segundo Gonçalves (2007) o BiGGEsTS (Biclustering Gene Expression Time-
Series) consiste numa ferramenta de análise, manipulação de diversos conjuntos de
dados de expressões genéticas. As suas funções principais são:
• Realiza a manipulação de dados de expressões genéticas em simultâneo;
• No sistema foram aplicados diversos algoritmos de pré-processamento
(filtragem de genes, preenchimento de valores em falta, normalização,
smoothing e discretização), algoritmos de biclustering e cálculo de
funções biológicas significativas para análise dos dados;
• O sistema permite a visualização dos dados ao decorrer do processo de
manipulação, utilizando-se representações gráficas inseridas
posteriormente, também é feito uma analise detalhada dos resultados
obtidos.
Abaixo pode ser visto apenas uma breve demonstração do sistema processando
dados provenientes de experiências biológicas reais com genes do organismo yest
(levedura) na figura 1 e 2 [Gonçalves 2007].
5. Considerações Finais
Neste trabalho foi apresentado como se deu o surgimento da bioinformática e a
interação entre diversas áreas do conhecimento para que suprisse a necessidade
eminente da área de biologia molecular, uma área que se encontra em constante
desenvolvimento.
Foi visto também que o Brasil se destacou com pesquisas referentes à área
de bioinformática trazendo eventos relevantes como congressos internacionais.
Fazendo uma breve descrição sobre bioinformática percebeu-se utilização
de técnicas de inteligência artificial para determinados problemas, sendo estes
constituídos das mais variadas formas. Citamos dois exemplos de aplicação da
Inteligência Artificial, uma utilizada em bancos de dados devido a necessidade de
análise e tratamento antes do armazenamento dos dados gerados pelas pesquisas
Figura 1: Painel de carregamento de dados.
Figura 2: Miniaturas dos gráficos de expressão dos 24 primeiros
biclusters do grupo de biclusters extraído pelo algoritmo CCC-Biclustering
aplicado à matriz discreta.
biológicas surgindo assim banco de dados robusto para suportar a grande
quantidade de informações. Através de suas técnicas foi criado um sistema de
relevante para a área de biologia molecular desenvolvido pela Joana Sofia de
Pinho Gonçalves.
Assim ao final deste trabalho percebemos a grande abrangência da
bioinformática, pois faz análises completas sobre os genes utilizando as mais
diversas formas de computação existentes, tentando sempre obter uma solução
ótima para os dados que se deseja manipular, trazendo benefícios de uma maneira
geral.
Referências
AB3C, Associação Brasileira de Bioinformática e Biologia Computacional. Incentivo a
Compreensão da importância da Biologia Computacional no Brasil e na América
Latina. Disponível em: < http://www.ab3c.org/>. Acessado em: 12 de julho de 2008.
ALGOSOBRE. Biologia: Projeto Genoma. Disponível em: <
http://www.algosobre.com.br/biologia/projeto-genoma.html>. Acessado em: 12 de
julho de 2008.
ARBEX, Wagner, COSTA, Vítor Santos, SILVA, Marcos Vinicius G. Barbosa da.
Bioinformática como Ferramenta nas Pesquisas Atuais. Disponível em: <
http://www.genmelhor.ufv.br/materiais/III%20egm/textobioinformatica.pdf>.
Acessado em: 11 de julho de 2008.
COSTA, Luciano da F.. Neurobioinformática: quando mentes e genes se encontram.
Disponível em: <
http://www.comciencia.br/reportagens/bioinformatica/bio11.shtml>. Acessado em:
11 de julho de 2008.
CRITCHLOW, T.; MUSICK, R.; SLEZAK, T. An Overview of Bioinformatics Research
at Lawrence Livermore National Laboratory. Califórnia: Department of Energy by
University of California Lawrence Livermore National Laboratory, 2000.
EMBRAPA. Brasil se destaca em congresso internacional de bioinformática.
Disponível em: < http://www.cnptia.embrapa.br/files/agrinforma04_06.pdf>.
Acessado em: 11 de julho de 2008.
GERHARDT, Isabel. "Ferrão" ajuda a achar função de proteína. Disponível em: <
http://www.cbi.cnptia.embrapa.br/press/fsp.html>. Acessado em: 12 de julho de
2008.
GONÇALVES, Joana Sofia de Pinho, MADEIRA. Biclustering Gene Expression Time-
Series. Disponível em:< http://www.inesc-id.pt/ficheiros/publicacoes/4309.pdf>.
Acessado em: 14 de julho de 2008.
FILHO, Fernando Camargo, PROSDOCIMI, Francisco, CERQUEIRA, Gustavo
Coutinho, BINNECK, Eliseu, SILVA, Acácia Fernandes, REIS, Adriana Neves dos,
JUNQUEIRA, Ana Carolina Martins, SANTOS, Ana Cecília Feio dos, JÚNIOR,
Antônio Nhani, WUST, Charles I., KESSEDJIAN, Jayme Lourenço, PETRETSKI,
Jorge H., CAMARGO, Luiz Paulo, FERREIRA, Ricardo de Godoi Mattos, LIMA,
Roceli P., PEREIRA, Rodrigo Matheus, JARDIM, Sílvia, SAMPAIO, Vanderson de
Souza, FOLGUERAS-FLATSCHART, Áurea V.. Bioinformática: Manual do
Usuário. Disponível em: <
http://www.biotecnologia.com.br/revista/bio29/bioinf.pdf>. Acessado em: 11 de
julho de 2008.
LEAL, Eduardo, WIECZOREK, Emilio Mario. Caminhos e Tendências do uso de
Banco de Dados em Bioinformática. Disponível em: <
http://www.wieczorek.com.br/publicacoes/artigo_IVencoinfo.pdf>>. Acessado em:
11 de julho de 2008.
LEAL, 2003, Eduardo, WIECZOREK, Emilio Mario. Padrões de Tipos e Métodos para
Banco de Dados em Bioinformática. III Congresso Científico do CEULP/ULBRA
2003. Disponível em:
<www.wieczorek.com.br/publicacoes/art_IIICongressoUlbra.pdf>. Acessado em: 11
de julho de 2008.
LEVY, Clayton. Instalado laboratório 'sem paredes' no campus. Embrapa usa
bioinformática na produção de novos produtos e na descoberta da cura de doenças
grave. Disponível em:
<http://www.unicamp.br/unicamp/unicamp_hoje/ju/outubro2002/unihoje_ju196pag9
b.html>. Acessado em: 12 de julho de 2008.
LUSA, Agência. Grupo de Inteligência Artificial UM investiga soluções informáticas.
Disponível em: <http://www.researchcafe.net/content/view/857/2/>. Acessado em:
14 de julho de 2008.
MAPA. São Paulo sedia congresso internacional de bioinformática. Disponível em: <
http://www.cnptia.embrapa.br/content/s-o-paulo-sedia-congresso-internacional-de-
bioinform-tica.html>. Acessado em: 12 de julho de 2008.
MARQUES, Eder Antonio Rangel, NETTO, Marcio Lobo. Projeto ALGA: Artificial
Life with Genethic Algorimts. Disponível em: <
http://www.lsi.usp.br/~lobonett/publications/2001.
11_SPUSP_ComputacaoCognitiva-CFV.pdf> . Acessado em: 11 de julho de 2008.
MIRANDA, Fabio Roberto, JUNIOR, João Eduardo Kogler, HERNANDES, Emilio
Del Moral, NETTO, Marcio Lobo. Projeto WOXBOT: Wide Open Extensible Robot.
Disponível em: < http://www.lsi.usp.br/~lobonett/publications/2001.
11_SPUSP_ComputacaoCognitiva-CFV.pdf> . Acessado em: 11 de julho de 2008.
MUNDO EDUCAÇÃO. Bioinformática. Disponível em: <
http://mundoeducacao.uol.com.br/informatica/bioinformatica.htm>. Acessado em: 12
de julho de 2008.
NEVES, Rogério Perino de Oliveira, NETTO, Marcio Lobo. Projeto ALIVE: Artificial
Life in Virtual Environments. Disponível em: <
http://www.lsi.usp.br/~lobonett/publications/2001.
11_SPUSP_ComputacaoCognitiva-CFV.pdf> . Acessado em: 11 de julho de 2008.
RUSSELL, Stuart, NORVIG, Peter. (2004). Inteligência Artificial.
SILVA, Walkiria Luckwu de Santana. Análise in silico de uma matriz DRE na
seqüência promotora de genes da Levedura Saccharomyces cerevisiae. Disponível
em < http://biolab.cin.ufpe.br/team/dissertacao_wlss.pdf> Acessado em 05 de junho
de 2008.
SOARES, Edson. Profissão do futuro: bioinformata vive entre bits e células.
Disponível em: <http://idgnow.uol.com.br/carreira/2006/05/02/idgnoticia. 2006-04-
28.1060287223/>. Acessado em: 12 de julho de 2008.

Mais conteúdo relacionado

Semelhante a 1228690340 ds

O comportamento do usuário final na recuperação temática da informação: um es...
O comportamento do usuário final na recuperação temática da informação: um es...O comportamento do usuário final na recuperação temática da informação: um es...
O comportamento do usuário final na recuperação temática da informação: um es...Rodrigo Moreira Garcia
 
Documento de Iniciação Científica - Estudo utilizando big data, twitter e gephi
Documento de Iniciação Científica - Estudo utilizando big data, twitter e gephiDocumento de Iniciação Científica - Estudo utilizando big data, twitter e gephi
Documento de Iniciação Científica - Estudo utilizando big data, twitter e gephiNewton Calegari
 
Exploring the Applications and Potential of Bioinformatics
Exploring the Applications and Potential of BioinformaticsExploring the Applications and Potential of Bioinformatics
Exploring the Applications and Potential of BioinformaticsLuana Joana Barreto Cabral
 
InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de DoençasInfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de DoençasCarlos Carvalho
 
Papel dos vocabulários no acesso e reuso de recursos digitais na web
Papel dos vocabulários no acesso e reuso de recursos digitais na webPapel dos vocabulários no acesso e reuso de recursos digitais na web
Papel dos vocabulários no acesso e reuso de recursos digitais na webmarco.dantas
 
Texto rede ci parreiras
Texto rede ci   parreirasTexto rede ci   parreiras
Texto rede ci parreirasRômulo Barros
 
Big data e o dirieto internacional - SILVA JR., Nelmon J.
Big data e o dirieto internacional - SILVA JR., Nelmon J.Big data e o dirieto internacional - SILVA JR., Nelmon J.
Big data e o dirieto internacional - SILVA JR., Nelmon J.Autônomo
 
Os novos alquimistas1
Os novos alquimistas1Os novos alquimistas1
Os novos alquimistas1elysioruggeri
 
Bioinformática e suas aplicações
Bioinformática e suas aplicaçõesBioinformática e suas aplicações
Bioinformática e suas aplicaçõesAlex Camargo
 
Rede Tecno-Econômica mobilizada para a geração de inovações em agrometeorolog...
Rede Tecno-Econômica mobilizada para a geração de inovações em agrometeorolog...Rede Tecno-Econômica mobilizada para a geração de inovações em agrometeorolog...
Rede Tecno-Econômica mobilizada para a geração de inovações em agrometeorolog...alcscens
 
Aula I: Informática em Saúde- UnB-FGA/Gama
Aula I: Informática em Saúde- UnB-FGA/GamaAula I: Informática em Saúde- UnB-FGA/Gama
Aula I: Informática em Saúde- UnB-FGA/GamaCamila Hamdan
 
BIG DATA E COMPUTATIONAL SOCIAL SCIENCE: GRANDES RISCOS
BIG DATA E COMPUTATIONAL SOCIAL SCIENCE: GRANDES RISCOSBIG DATA E COMPUTATIONAL SOCIAL SCIENCE: GRANDES RISCOS
BIG DATA E COMPUTATIONAL SOCIAL SCIENCE: GRANDES RISCOSVivaldo Jose Breternitz
 
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASILSISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASILMiguel Angel Mardero Arellano
 
Palestra na Unirio - Tese de Doutorado
Palestra na Unirio - Tese de DoutoradoPalestra na Unirio - Tese de Doutorado
Palestra na Unirio - Tese de DoutoradoLuiz Agner
 
Defesa de doutorado - Miguel Arellano
Defesa de doutorado - Miguel ArellanoDefesa de doutorado - Miguel Arellano
Defesa de doutorado - Miguel ArellanoCariniana Rede
 

Semelhante a 1228690340 ds (20)

O comportamento do usuário final na recuperação temática da informação: um es...
O comportamento do usuário final na recuperação temática da informação: um es...O comportamento do usuário final na recuperação temática da informação: um es...
O comportamento do usuário final na recuperação temática da informação: um es...
 
Documento de Iniciação Científica - Estudo utilizando big data, twitter e gephi
Documento de Iniciação Científica - Estudo utilizando big data, twitter e gephiDocumento de Iniciação Científica - Estudo utilizando big data, twitter e gephi
Documento de Iniciação Científica - Estudo utilizando big data, twitter e gephi
 
Exploring the Applications and Potential of Bioinformatics
Exploring the Applications and Potential of BioinformaticsExploring the Applications and Potential of Bioinformatics
Exploring the Applications and Potential of Bioinformatics
 
InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de DoençasInfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
 
Papel dos vocabulários no acesso e reuso de recursos digitais na web
Papel dos vocabulários no acesso e reuso de recursos digitais na webPapel dos vocabulários no acesso e reuso de recursos digitais na web
Papel dos vocabulários no acesso e reuso de recursos digitais na web
 
Texto rede ci parreiras
Texto rede ci   parreirasTexto rede ci   parreiras
Texto rede ci parreiras
 
Big data e o dirieto internacional - SILVA JR., Nelmon J.
Big data e o dirieto internacional - SILVA JR., Nelmon J.Big data e o dirieto internacional - SILVA JR., Nelmon J.
Big data e o dirieto internacional - SILVA JR., Nelmon J.
 
Os novos alquimistas1
Os novos alquimistas1Os novos alquimistas1
Os novos alquimistas1
 
ACC-Bioinformatica-Seminario
ACC-Bioinformatica-SeminarioACC-Bioinformatica-Seminario
ACC-Bioinformatica-Seminario
 
DAMICORE - conceito e prática
DAMICORE - conceito e práticaDAMICORE - conceito e prática
DAMICORE - conceito e prática
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
 
Palestra sobre Bioinformática
Palestra sobre BioinformáticaPalestra sobre Bioinformática
Palestra sobre Bioinformática
 
Bioinformática e suas aplicações
Bioinformática e suas aplicaçõesBioinformática e suas aplicações
Bioinformática e suas aplicações
 
Projeto para Uso das TICs em Aula
Projeto para Uso das TICs em AulaProjeto para Uso das TICs em Aula
Projeto para Uso das TICs em Aula
 
Rede Tecno-Econômica mobilizada para a geração de inovações em agrometeorolog...
Rede Tecno-Econômica mobilizada para a geração de inovações em agrometeorolog...Rede Tecno-Econômica mobilizada para a geração de inovações em agrometeorolog...
Rede Tecno-Econômica mobilizada para a geração de inovações em agrometeorolog...
 
Aula I: Informática em Saúde- UnB-FGA/Gama
Aula I: Informática em Saúde- UnB-FGA/GamaAula I: Informática em Saúde- UnB-FGA/Gama
Aula I: Informática em Saúde- UnB-FGA/Gama
 
BIG DATA E COMPUTATIONAL SOCIAL SCIENCE: GRANDES RISCOS
BIG DATA E COMPUTATIONAL SOCIAL SCIENCE: GRANDES RISCOSBIG DATA E COMPUTATIONAL SOCIAL SCIENCE: GRANDES RISCOS
BIG DATA E COMPUTATIONAL SOCIAL SCIENCE: GRANDES RISCOS
 
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASILSISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
 
Palestra na Unirio - Tese de Doutorado
Palestra na Unirio - Tese de DoutoradoPalestra na Unirio - Tese de Doutorado
Palestra na Unirio - Tese de Doutorado
 
Defesa de doutorado - Miguel Arellano
Defesa de doutorado - Miguel ArellanoDefesa de doutorado - Miguel Arellano
Defesa de doutorado - Miguel Arellano
 

Último

Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...Dirceu Resende
 
Knowtree - Extração de Dados com o KAPE.
Knowtree - Extração de Dados com o KAPE.Knowtree - Extração de Dados com o KAPE.
Knowtree - Extração de Dados com o KAPE.Thiago lindolfo
 
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...Dirceu Resende
 
TI EXAMES - NIST Cybersecurity Framework.pdf
TI EXAMES - NIST Cybersecurity Framework.pdfTI EXAMES - NIST Cybersecurity Framework.pdf
TI EXAMES - NIST Cybersecurity Framework.pdfRodrigoMori7
 
PRODUCT OPS - COMO APROVEITAR O MÁXIMO DESTA NOVA TENDÊNCIA - Priscila Chagas...
PRODUCT OPS - COMO APROVEITAR O MÁXIMO DESTA NOVA TENDÊNCIA - Priscila Chagas...PRODUCT OPS - COMO APROVEITAR O MÁXIMO DESTA NOVA TENDÊNCIA - Priscila Chagas...
PRODUCT OPS - COMO APROVEITAR O MÁXIMO DESTA NOVA TENDÊNCIA - Priscila Chagas...Priscila Ribeiro Chagas
 
O papel da automação de processos no mundo do trabalho pós-moderno
O papel da automação de processos no mundo do trabalho pós-modernoO papel da automação de processos no mundo do trabalho pós-moderno
O papel da automação de processos no mundo do trabalho pós-modernoDenis Pereira Raymundo
 
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...Dirceu Resende
 

Último (7)

Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
 
Knowtree - Extração de Dados com o KAPE.
Knowtree - Extração de Dados com o KAPE.Knowtree - Extração de Dados com o KAPE.
Knowtree - Extração de Dados com o KAPE.
 
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
 
TI EXAMES - NIST Cybersecurity Framework.pdf
TI EXAMES - NIST Cybersecurity Framework.pdfTI EXAMES - NIST Cybersecurity Framework.pdf
TI EXAMES - NIST Cybersecurity Framework.pdf
 
PRODUCT OPS - COMO APROVEITAR O MÁXIMO DESTA NOVA TENDÊNCIA - Priscila Chagas...
PRODUCT OPS - COMO APROVEITAR O MÁXIMO DESTA NOVA TENDÊNCIA - Priscila Chagas...PRODUCT OPS - COMO APROVEITAR O MÁXIMO DESTA NOVA TENDÊNCIA - Priscila Chagas...
PRODUCT OPS - COMO APROVEITAR O MÁXIMO DESTA NOVA TENDÊNCIA - Priscila Chagas...
 
O papel da automação de processos no mundo do trabalho pós-moderno
O papel da automação de processos no mundo do trabalho pós-modernoO papel da automação de processos no mundo do trabalho pós-moderno
O papel da automação de processos no mundo do trabalho pós-moderno
 
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
Apresentação Power Embedded - Descubra uma nova forma de compartilhar relatór...
 

1228690340 ds

  • 1. Bioinformática Bruno Ferreira Rezende, Diogo Santos da Silva Universidade Federal de Mato Grosso - Campus Universitário de Rondonópolis Instituto de Ciências Exatas e Naturais - Curso de Licenciatura em Informática Disciplina de Inteligência Artificial - Professora Soraia Silva Prietch Rondonópolis – MT – Brasil {brunofr84, diogo83}@gmail.com Resumo. Este trabalho fala sobre o começo da bioinformática e o seu relacionamento com outras áreas. Cita algumas características particulares que mostra sua importância para a colaboração do melhoramento e desenvolvimento de novas técnicas de pesquisa em bancos de dados e inteligência artificial onde são aplicadas técnicas padrões, mas que em sua maioria foram criadas para atender pequena quantidade de dados o que difere das grandes quantidades de informação, devendo assim ser adaptadas para tal função. A importância da análise e manipulação dos dados antes de serem armazenados. Comentaremos também alguns projetos brasileiros e como funciona a integração de bancos de dados genômicos. Abstract. This work is about the beggining of bioinformatics and its relationship to other areas. Quote some particular characteristics that shows its importance to the cooperation of the improvement and development of new techniques in search of databases and artificial intelligence where technical standards are applied, but most of them were created to serve small amount of data which differs from large amounts of information and should therefore be adapted for this function. The importance of analysis and manipulation of data before being stored. We will comment also some Brazilian projects and how the integration of genomic data banks. 1. Introdução Com a realização de pesquisas envolvendo geneticistas e químicos surgiu à conclusão que o DNA era a molécula que armazenava a informação genética, em 1953, sua estrutura ficou conhecida pelo trabalho desenvolvido por Watson e Crick. Posteriormente surgiram métodos de seqüenciamento dos polímeros do DNA, permitindo o estudo das formas mais simples que o constitui. Por volta da década de 90, começaram a surgir seqüenciadores automáticos de DNA aumentando consideravelmente a quantidade de seqüências genéticas a serem armazenadas conseqüentemente exigindo cada vez mais recursos computacionais como armazenamento e interpretação dos resultados obtidos, surgia assim à bioinformática [Filho 2002].
  • 2. Essa nova ciência segundo Filho (2002) envolve diversas áreas do conhecimento, tais como a engenharia de softwares, a matemática, a estatística, a ciência da computação, biologia molecular, etc. A dificuldade de comunicação dos profissionais dessas diferentes áreas criou a necessidade de um novo profissional que possuísse conhecimento para fazer a ligação dessas ciências o Bioinformata [Filho 2002, Silva 2003]. Como na evolução da genética também houve a evolução da informática o que fez com que surgissem diferentes áreas de estudo e técnicas. Foram criados inúmeros grupos de pesquisas para serem usadas na bioinformática nas mais variadas aplicações como: Simulação em ambientes virtuais de organismos semelhantes aos reais analisando o seu comportamento e obtendo resultados antes só adquiridos através de testes feitos com organismos reais. Simulação citada no projeto ALIVE de Neves e Neto (2003); Projeto Alga de Marques e Neto (2002), que busca através de um ambiente virtual simular o comportamento de uma alga especifica frente a várias condições climáticas e outros fatores. Tem muitos outros projetos e grupos de estudo foram citados esses dois como exemplos. A inteligência artificial tem um importante papel na bioinformática, como em redes neurais onde através de algoritmos genéticos busca a melhor solução para um problema especifico como é o caso do projeto WOXBOT de Miranda (2004) onde faz a seleção de personagens mais bem adaptados em um ambiente virtual. Auxilia também na análise de dados como cita Costa (2003), que a inteligência artificial tem evoluído proporcionando análises cada vez mais completas dos demais dados biológicos. 1.1. Justificativa O estudo do seqüenciamento genético foi o grande propulsor da bioinformática, surgiu da necessidade da integração de varias ciências dentre elas a informática que desempenha função fundamental nessa ciência. A bioinformática se torna de grande importância para a ciência, pois através dela segundo Leal (2002) pode-se construir base de dados contendo informações dos genes e proteínas dos organismos vivos, podendo ocorrer à descoberta de novos genes e medicamentos. Na bioinformática são utilizadas técnicas de inteligência artificial para tanto fazer a analises de dados quanto tomadas de decisões segundo Costa (2003) e Miranda (2004). 1.2. Objetivos Este trabalho tem como objetivo principal descrever o surgimento da Bioinformática e posteriormente destacar sua importância para a biologia molecular bem como algumas influências da Inteligência Artificial exerce sobre alguns trabalhos desenvolvidos nessa nova ciência. E por final descrever algumas aplicações das técnicas utilizadas na computação na bioinformática expondo o objetivo de alguns trabalhos já realizados 2. Metodologia de Pesquisa Este trabalho tem como objetivo uma pesquisa sobre a bioinformática utilizando de meios como um livro referente a métodos utilizados na área referida e também artigos encontrados de forma digital.
  • 3. 3. Revisão de literatura Segundo Arbex (2006), a bioinformática teve como fator para o seu fortalecimento o projeto Genoma, visto que a necessidade de um sistema de computação que armazenasse e analisasse as enormes quantidades de dados gerados por esse projeto se torna imprescindível e exige cada vez mais da área da computação. Essa nova ciência é interdisciplinar promovendo a interação de profissionais de diversas áreas do conhecimento conforme diz a AB3C (Associação Brasileira de Bioinformática e Biologia Computacional) e Filho (2002) exemplifica essas áreas como sendo de engenharia de softwares, a matemática, a estatística, a ciência da computação e a biologia molecular. Segundo Arbex (2006), há a necessidade de sistemas computacionais de grande porte bem profissionais especializados para a manipulação do mesmo. Com isso surge um novo profissional o Bioinformata. O Bioinformata falando de forma resumida segundo Soares (2006) utiliza a computação como meio de resolver problemas biológicos. Assim conforme afirma Arbex (2006) esse profissional precisa ter conhecimento sobre: • Biologia molecular, para, no mínimo, entender o problema; • Matemática e probabilidade, de forma que fosse capaz de estabelecer um modelo de representação do problema; • Computação, possibilitando a implementação da solução correta e apropriada, sendo esta inicialmente conhecida ou não; • Estatística, para que as soluções fossem comprovadamente confiáveis. Segundo Filho (2002) esse profissional deve ter conhecimento sobre os problemas biológicos reais e através de meios computacionais tentar resolver o referido problema. Assim são utilizadas varias técnicas computacionais para ensinar as máquinas que serão utilizadas na bioinformática como redes neurais artificiais, máquinas de vetores suporte, árvores de decisão, algoritmos genéticos, algoritmos de agrupamento, cadeias escondidas de Markov (HMMs) conforme citado no site Mundo Educação. Apesar de a bioinformática ter surgido como afirma Arbex (2006) com o projeto Genoma, o que deu seus primeiros passos nos EUA criado por setores privados e posteriormente passou a ser alvo internacional pela sua perspectiva financeira se espalhando por vários países inclusive o Brasil [Algosobre]. 3.1. Bioinformática no Brasil Segundo Gerhardt (2001) a bioinformática teve seu pioneirismo com a vinda de Neshich de origem sérvia, onde foi o idealizador do projeto BBNet (BrazilianBioNet), uma rede de usuários da bioinformática, formada em 1992, que propiciou os primeiros contatos de cientistas brasileiros a programas de análise de seqüência de DNA de forma gratuita, por
  • 4. intermédio de um computador (servidor) da Embrapa Recursos Genéticos e Biotecnologia. Depois desse projeto surgiram muitos outros como também a construção de núcleos especializados que realiza trabalhos específicos como traz a matéria de Levy (2002) onde divulga a construção do NBI (Núcleo de Bioinformática), um sofistica laboratório construído no prédio da UNICAMP. Que por meio de simulações feitas através de um software nacional, chamado de Sting, em computadores, permitirá o estudo do genoma estrutural e genoma funcional. Foi criada também uma a AB3C (Associação Brasileira de Bioinformática e Biologia Computacional) que tem por objetivo promover a interação de vários especialistas de áreas relevantes como biologia, medicina, ciência da computação, etc. A bioinformática tem no Brasil vários projetos associados a grupos de estudos com objetivo em comum para tentar solucionar um problema específico como citado pelo Departamento de Engenharia de Sistemas Eletrônicos - PSI/EPUSP onde há 5 grupos onde cada um busca uma solução para um problema específico [Miranda 2004, Marques 2002 e Neves 2003]. Outro programa criado que promoveu a disseminação da bioinformática no Brasil foi a rede Onsa (sigla, em inglês, para Organization for Nucleotide Sequencing and Analysis) essa rede permitia o estudo virtual e dinâmico com as instituição associadas. Vários centros de pesquisa foram criados a partir dessa rede espalhando por diversas instituições em diversos estados brasileiros como na Unicamp, na USP, na Unesp, no Instituto Ludwig, no Laboratório Nacional de Computação Científica, no Rio de Janeiro, na Universidade Federal de Pernambuco, na Federal de Minas Gerais e na Federal do Rio Grande do Sul [Vogt 2003]. E uma das provas que o Brasil esta se destacando na Bioinformática no cenário Internacional foi à realização do Congresso Internacional de Bioinformática segundo a Embrapa (2006) em 2006 foi em Fortaleza e segundo MAPA (2007) em 2007 foi em São Paulo. Esse encontro promove a interação entre diversas comunidades cientificas na área de biologia computacional e também estudantes onde podem trocar idéias e aperfeiçoar seus trabalhos [Embrapa 2006]. 3.2. Técnicas Utilizadas na Bioinformática Segundo o Mundo Educação são utilizadas técnicas de inteligência artificial no ensino do computador que será utilizado na bioinformática como redes neurais artificiais, máquinas de vetores suporte, árvores de decisão, algoritmos genéticos, algoritmos de agrupamento, cadeias escondidas de Markov (HMMs). De acordo com Russell (2004) será apresentada uma breve explicação do que consistem algumas técnicas de Inteligência Artificial que são utilizadas em bioinformática como: • Redes Neurais: são funções não-lineares complexas com muitos parâmetros. Seus parâmetros podem ser aprendidos a partir de dados ruidosos, e elas são usadas em milhares de aplicações;
  • 5. • Máquinas de Vetores de Suporte: utiliza algoritmos de treinamento eficiente e podem representar funções complexas não-lineares; • Cadeias Escondidas de Makov: fornece uma estimativa razoáveis das probabilidades posteriores verdadeiras em uma rede e podem lidar com redes muitos maiores do que os algoritmos exatos; • Árvores de Decisão: podem representar todas as funções booleanas. Uma árvore de decisão alcança sua decisão executando uma seqüência de testes. • Algoritmos Genéticos: é uma forma de busca aleatória onde os sucessores são gerados a partir de dois estados pais, em vez de serem gerados modificados de um único estado. • Algoritmos de Agrupamento: faz os agrupamentos de dados de padrões 4. Aplicação O elevado número de informações geradas todos os dias pelo mapeamento de genes necessitam ser armazenadas de forma sistemática em bancos de dados computacionais, servindo de base para estudos médicos e biológicos através da Bioinformática [Leal, 2008]. Segundo Silva (2004) essa elevada quantidade de informações precisa ser cuidadosamente decifrada e com a organização e decodificação, podem-se encontrar informações muito valiosas sobre os mecanismos biológicos. Para isso, é necessária uma adaptação dos Sistemas Gerenciadores de Banco de Dados para poderem suportar os dados gênicos (de genoma), a fim de se fazer um armazenamento e busca destes dados da maneira mais excelente possível [Leal]. Ainda segundo Leal (2003), a maioria dos bancos de dados biológicos, consiste em longas cadeias de caracteres para representar as bases do DNA. OS bancos de dados normalmente são usados para fins administrativos, e poucos possuem a capacidade de lidar com dados complexos, como dados multimídia ou dados genéticos (sucessão de genes). Uma das metas da Bioinformática é agilizar a busca dessas informações, localizando sinais prováveis de genes e produtos de genes de seqüências de DNA ainda não caracterizadas experimentalmente. Mas para isso não basta apenas os conceitos de métodos rápidos de busca, é preciso uma base biológica para compreensão das informações a serem relacionadas e extraídas [Silva]. Leal (2003) descreve que para revolver este problema, deve ser feita uma padronização de tipos de dados e métodos que os bancos de dados devem suportar, relacionando-os e descrevendo suas funcionalidades. Surge assim necessidade de se possuir diferenciadas formas de armazenamento, tratamento, acesso e pesquisa dos dados, para que se consiga trazer a informação da melhor maneira desejada possível. A primeira medida a ser tomada é adotar Sistemas Gerenciadores de Banco de Dados com suporte para a criação de novos tipos de dados e métodos. Este banco de dados extensível dará o apoio necessário às necessidades do sistema para definir novos
  • 6. tipos de dados que sejam capazes de: criar entidades de domínio como sucessão genotípica; fazer uso de operadores definidos pelo usuário; criar indexação de domínio específico, fornecendo apoio para índices específicos de dados biológicos e otimizar a extensibilidade, fazendo assim uma ordenação inteligente dos predicados em questão, envolvendo tipos de dados definidos pelo usuário [Leal, 2003]. Depois disto, adotar sistemas envolvendo Data Warehouses (Armazéns de Dados), pois estes são constituídos tipicamente de 5 camadas: as fontes de dados, que contém os dados a serem integrados ao Data Warehouse através dos Wrapper’s (analisadores gramaticais de dados), os mediadores (que traduzem os dados para a representação do Data Warehouse), o próprio Data Warehouse, que é um grande repositório de dados, geralmente um banco de dados relacional, que possui uma visão consistente dos dados provenientes das fontes de dados, e finalmente os usuários, que interagem com o sistema através de uma interface. Características presentes Oracle SQL Server [Leal, 2003] Segundo Critchlow, o desafio para a criação de um Data Warehouse para o ambiente da bioinformática está no fato de que se deve desenvolver uma infra-estrutura flexível o bastante para controlar a natureza dinâmica do domínio, pois fontes de dados para aplicações científicas são extremamente dinâmicas. Sempre que uma fonte de dados muda seus dados, o Wrapper e o mediador devem ser atualizados para que estas atualizações sejam espelhadas no Data Warehouse. Uma terceira abordagem é a utilização de bases de dados XML, pois através da construção de documentos de definição XML permite fazer conversões entre bancos de dados que se utilizam de diferentes tecnologias de XML. A grande preocupação neste caso é de como integrar as diversas bases de dados XML, já que os dados biológicos não possuem uma estrutura padrão, pois os dados podem variar de tipo de uma base para outra [Leal, 2003]. Um outro ponto a ser tratado são os Bancos de Dados Públicos sobre Bioinformática. São BDs envolvendo seqüencial de nucleotídeos, aminoácidos ou estruturas de proteínas cada uma delas podendo ser classificadas em bancos de seqüências primárias ou secundárias. Os primários são formados pela disposição direta das seqüências de nucleotídeos, aminoácidos ou estruturas protéicas sem qualquer processamento ou análise. Dentre os principais temos: GenBank, EBI (European Bioinformatics Bank), DDBJ (DNA Data Bank of Japan). Estes bancos são membros do INSDC (International Nucleotide Se-quenceDatabase Colaboration) onde cada um deles permite a submissão individual de seqüências de DNA e trocam informações diárias entre si. Já os bancos secundários são derivados dos primários. Eles contêm informações contidas nos bancos primários, mas que, por exemplo, foram coletadas informações de seqüências protéicas e associadas a informações sobre função, domínios funcionais, proteínas homólogas e outros. Quanto à aplicação da Inteligência Artificial na Bioinformática, encontramos exemplos como o da Lusa Universidade do Minho onde existem estudos para fazer a leitura e o armazenamento em bases de dados de estruturas genéticas como o ADN ou o
  • 7. genoma humano ainda testar a possibilidade de melhoria de métodos de análise multidimensional de bases de dados [Lusa]. Segundo Pedro Henriques "A aplicação da inteligência artificial, em bases de dados com vários milhões de registros, simplifica as conclusões sobre hábitos de consumo, sazonalidade, entre outros, o que é de grande valia para a tomada de decisões". Seguindo essa analogia encontramos na revista Reciis sobre Biomarcadores e a Proteômica sobre A identificação de painéis de biomarcadores, esta técnica desafia o campo da prote-ômica exigindo cada vez mais sensibilidade e poder de quantificação que os das técnicas existentes. Este problema atinge também a Inteligência Artificial no setor de reconhecimento de padrões. Onde maior parte dos dados obtidos são limitados devido ao baixo número de amostras disponíveis para pesquisa. “Outros fatores limitantes são: o custo dos equipamentos e reagentes, o elevado número de parâmetros por amostra, grande variabilidade entre amostras de mesma classe, limitações na reprodutibilidade das técnicas proteômicas para detecção e quantificação simultânea de milhares de proteínas, e a falta de conhecimento de uma função de densidade de probabilidade que descreva adequadamente a variação do nível de expressão de cada proteína para o caso em estudo.” Para tornar eficientes as buscas e análises de bancos de dados podem ser utilizadas técnicas de inteligência Artificial e sistemas desenvolvidos para realizar mineração e analises de dados em problemas no qual pretende se obter uma solução, como foi o caso da Joana S. de P. Gonçalves (2007), ganhadora do Prêmio Nacional de Trabalhos de Licenciatura, atribuído pela associação portuguesa para inteligência artificial, que desenvolveu o sistema BiGGEsTS. Segundo Gonçalves (2007) o BiGGEsTS (Biclustering Gene Expression Time- Series) consiste numa ferramenta de análise, manipulação de diversos conjuntos de dados de expressões genéticas. As suas funções principais são: • Realiza a manipulação de dados de expressões genéticas em simultâneo; • No sistema foram aplicados diversos algoritmos de pré-processamento (filtragem de genes, preenchimento de valores em falta, normalização, smoothing e discretização), algoritmos de biclustering e cálculo de funções biológicas significativas para análise dos dados; • O sistema permite a visualização dos dados ao decorrer do processo de manipulação, utilizando-se representações gráficas inseridas posteriormente, também é feito uma analise detalhada dos resultados obtidos. Abaixo pode ser visto apenas uma breve demonstração do sistema processando dados provenientes de experiências biológicas reais com genes do organismo yest (levedura) na figura 1 e 2 [Gonçalves 2007].
  • 8. 5. Considerações Finais Neste trabalho foi apresentado como se deu o surgimento da bioinformática e a interação entre diversas áreas do conhecimento para que suprisse a necessidade eminente da área de biologia molecular, uma área que se encontra em constante desenvolvimento. Foi visto também que o Brasil se destacou com pesquisas referentes à área de bioinformática trazendo eventos relevantes como congressos internacionais. Fazendo uma breve descrição sobre bioinformática percebeu-se utilização de técnicas de inteligência artificial para determinados problemas, sendo estes constituídos das mais variadas formas. Citamos dois exemplos de aplicação da Inteligência Artificial, uma utilizada em bancos de dados devido a necessidade de análise e tratamento antes do armazenamento dos dados gerados pelas pesquisas Figura 1: Painel de carregamento de dados. Figura 2: Miniaturas dos gráficos de expressão dos 24 primeiros biclusters do grupo de biclusters extraído pelo algoritmo CCC-Biclustering aplicado à matriz discreta.
  • 9. biológicas surgindo assim banco de dados robusto para suportar a grande quantidade de informações. Através de suas técnicas foi criado um sistema de relevante para a área de biologia molecular desenvolvido pela Joana Sofia de Pinho Gonçalves. Assim ao final deste trabalho percebemos a grande abrangência da bioinformática, pois faz análises completas sobre os genes utilizando as mais diversas formas de computação existentes, tentando sempre obter uma solução ótima para os dados que se deseja manipular, trazendo benefícios de uma maneira geral. Referências AB3C, Associação Brasileira de Bioinformática e Biologia Computacional. Incentivo a Compreensão da importância da Biologia Computacional no Brasil e na América Latina. Disponível em: < http://www.ab3c.org/>. Acessado em: 12 de julho de 2008. ALGOSOBRE. Biologia: Projeto Genoma. Disponível em: < http://www.algosobre.com.br/biologia/projeto-genoma.html>. Acessado em: 12 de julho de 2008. ARBEX, Wagner, COSTA, Vítor Santos, SILVA, Marcos Vinicius G. Barbosa da. Bioinformática como Ferramenta nas Pesquisas Atuais. Disponível em: < http://www.genmelhor.ufv.br/materiais/III%20egm/textobioinformatica.pdf>. Acessado em: 11 de julho de 2008. COSTA, Luciano da F.. Neurobioinformática: quando mentes e genes se encontram. Disponível em: < http://www.comciencia.br/reportagens/bioinformatica/bio11.shtml>. Acessado em: 11 de julho de 2008. CRITCHLOW, T.; MUSICK, R.; SLEZAK, T. An Overview of Bioinformatics Research at Lawrence Livermore National Laboratory. Califórnia: Department of Energy by University of California Lawrence Livermore National Laboratory, 2000. EMBRAPA. Brasil se destaca em congresso internacional de bioinformática. Disponível em: < http://www.cnptia.embrapa.br/files/agrinforma04_06.pdf>. Acessado em: 11 de julho de 2008. GERHARDT, Isabel. "Ferrão" ajuda a achar função de proteína. Disponível em: < http://www.cbi.cnptia.embrapa.br/press/fsp.html>. Acessado em: 12 de julho de 2008. GONÇALVES, Joana Sofia de Pinho, MADEIRA. Biclustering Gene Expression Time- Series. Disponível em:< http://www.inesc-id.pt/ficheiros/publicacoes/4309.pdf>. Acessado em: 14 de julho de 2008. FILHO, Fernando Camargo, PROSDOCIMI, Francisco, CERQUEIRA, Gustavo Coutinho, BINNECK, Eliseu, SILVA, Acácia Fernandes, REIS, Adriana Neves dos, JUNQUEIRA, Ana Carolina Martins, SANTOS, Ana Cecília Feio dos, JÚNIOR, Antônio Nhani, WUST, Charles I., KESSEDJIAN, Jayme Lourenço, PETRETSKI, Jorge H., CAMARGO, Luiz Paulo, FERREIRA, Ricardo de Godoi Mattos, LIMA,
  • 10. Roceli P., PEREIRA, Rodrigo Matheus, JARDIM, Sílvia, SAMPAIO, Vanderson de Souza, FOLGUERAS-FLATSCHART, Áurea V.. Bioinformática: Manual do Usuário. Disponível em: < http://www.biotecnologia.com.br/revista/bio29/bioinf.pdf>. Acessado em: 11 de julho de 2008. LEAL, Eduardo, WIECZOREK, Emilio Mario. Caminhos e Tendências do uso de Banco de Dados em Bioinformática. Disponível em: < http://www.wieczorek.com.br/publicacoes/artigo_IVencoinfo.pdf>>. Acessado em: 11 de julho de 2008. LEAL, 2003, Eduardo, WIECZOREK, Emilio Mario. Padrões de Tipos e Métodos para Banco de Dados em Bioinformática. III Congresso Científico do CEULP/ULBRA 2003. Disponível em: <www.wieczorek.com.br/publicacoes/art_IIICongressoUlbra.pdf>. Acessado em: 11 de julho de 2008. LEVY, Clayton. Instalado laboratório 'sem paredes' no campus. Embrapa usa bioinformática na produção de novos produtos e na descoberta da cura de doenças grave. Disponível em: <http://www.unicamp.br/unicamp/unicamp_hoje/ju/outubro2002/unihoje_ju196pag9 b.html>. Acessado em: 12 de julho de 2008. LUSA, Agência. Grupo de Inteligência Artificial UM investiga soluções informáticas. Disponível em: <http://www.researchcafe.net/content/view/857/2/>. Acessado em: 14 de julho de 2008. MAPA. São Paulo sedia congresso internacional de bioinformática. Disponível em: < http://www.cnptia.embrapa.br/content/s-o-paulo-sedia-congresso-internacional-de- bioinform-tica.html>. Acessado em: 12 de julho de 2008. MARQUES, Eder Antonio Rangel, NETTO, Marcio Lobo. Projeto ALGA: Artificial Life with Genethic Algorimts. Disponível em: < http://www.lsi.usp.br/~lobonett/publications/2001. 11_SPUSP_ComputacaoCognitiva-CFV.pdf> . Acessado em: 11 de julho de 2008. MIRANDA, Fabio Roberto, JUNIOR, João Eduardo Kogler, HERNANDES, Emilio Del Moral, NETTO, Marcio Lobo. Projeto WOXBOT: Wide Open Extensible Robot. Disponível em: < http://www.lsi.usp.br/~lobonett/publications/2001. 11_SPUSP_ComputacaoCognitiva-CFV.pdf> . Acessado em: 11 de julho de 2008. MUNDO EDUCAÇÃO. Bioinformática. Disponível em: < http://mundoeducacao.uol.com.br/informatica/bioinformatica.htm>. Acessado em: 12 de julho de 2008. NEVES, Rogério Perino de Oliveira, NETTO, Marcio Lobo. Projeto ALIVE: Artificial Life in Virtual Environments. Disponível em: < http://www.lsi.usp.br/~lobonett/publications/2001. 11_SPUSP_ComputacaoCognitiva-CFV.pdf> . Acessado em: 11 de julho de 2008. RUSSELL, Stuart, NORVIG, Peter. (2004). Inteligência Artificial.
  • 11. SILVA, Walkiria Luckwu de Santana. Análise in silico de uma matriz DRE na seqüência promotora de genes da Levedura Saccharomyces cerevisiae. Disponível em < http://biolab.cin.ufpe.br/team/dissertacao_wlss.pdf> Acessado em 05 de junho de 2008. SOARES, Edson. Profissão do futuro: bioinformata vive entre bits e células. Disponível em: <http://idgnow.uol.com.br/carreira/2006/05/02/idgnoticia. 2006-04- 28.1060287223/>. Acessado em: 12 de julho de 2008.