SlideShare uma empresa Scribd logo
1 de 58
Baixar para ler offline
INTRODUÇÃO A BANCOS DE
             DADOS BIOLÓGICOS




FELIPE GUIMARÃES TORRES
COORDENADO PELO PROF. MÁRCIO SOUSSA
NÚCLEO DE SERVIÇOS TECNOLÓGICOS - NST
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONTATO




FELIPE GUIMARÃES TORRES

              fgtorres18@gmail.com

              http://www.facebook.com/felipe.g.torres.5


              http://www.twitter.com/felipegtorres

              http://www.slideshare.net/fgtorres
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – AGENDA




                                                  9.  Conceitos mate-
             1.  Biologia Básica                      máticos.
             2.  Seres vivos                      10. Prática.
             3.  Células                          11. TecJorge.
             4.  DNA                              12. Referências.
             5.  História do con-
                 ceito de BDB.
             6.  Evolução de Re-
                 curso.

             7.  Bancos de Dados
                 Biológicos
             8.  Arquitetura com-
                 putacional de um
                 BDB.
BIOLOGIA BÁSICA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




                                                           Seres vivos…
                            Seres formados por células…
                                             Exceção dos vírus…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




                          Células
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
NOME DO CURSO – NOME DO BLOCO




                                                           Procarióticas…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




  Eucarióticas…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




                                    Ácido desoxirribonucléico. Armazena
                                    informações genéticas em genes.
                                    São formados por monômeros
                                    conhecidos como nucleotídeos.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




                          Estrutura nucleotídica …
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




                       Relações entre nucleotídeos…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




                                                   Estrutura do DNA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




                          Ligações entre nucleotídeos




                                                       Fosfodiéster…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




                          Ligações entre nucleotídeos




                              Pontes de Hidrogênio…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA




Dogma central…
HISTÓRIA DO CONCEITO BDB’S
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S




                                                                1982
                                       1970
              1965
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S




             Década de 60…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S




  Tempo         13 anos (1990 - 2003)

  Custo         U$3.8 bilhões
INTRODUÇÃO BANCO DE D. B. ESTRUT. COMP. DADOS BIO. BANCO DE DADOS ATUAIS FERRAMENTAS
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S




                                                       ILLUMINA HISEQ2000
            SANGER                                 TOTAL DE BASES: 35 ~ 200 Gb
                                                   TEMPO DA CORRIDA: 1.5 a 8 dias
TOTAL DE BASES: 30~ 350 kb                         CUSTO: MENOS DE U$1/Mb
TEMPO DA CORRIDA: 15 HORAS
CUSTO: U$1000/Mb
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S




   GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO
               GENBANK ENTRE 1995 A 2011.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S




   GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO
                 GOLD ENTRE 1997 A 2011.
BANCOS DE DADOS
   BIOLÓGICOS
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS




Banco de dados
biológicos são locais
computacionais para o
armazenamento de
dados biológicos.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS




                              Dados Biológicos
Sequências de DNA…
Sequências de Proteínas…
Anotações…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS




                                          Tipos de BDB
Primários…
Secundários…
Especializados…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS




Primários…
                       Armazenam informações biológicas
                                              originais.


              Armazenam normalmente em
              arquivos de texto. Ex.: Fasta.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS




                                   Secundários…

  Armazenam resultados de análises feitas a
                 partir de dados primários.


    Utilizam SGBD`s e estruturas computacionais
                                mais complexas.
ARQUITETURA COMPUTACIONAL
        DE UM BDB
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB




                                          Modelos de BD


                                                      Arquivo de texto….
                               Relacional…
                                                  Orientado a objeto….
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB




                                                         Relacional


                                 Planilhas que se relacionam…
 Utilizando o conceito de keys…
                             Largamente utilizado e estável…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB




                                                         Relacional




                             Exemplo de modelo relacional…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB




                                                                               OO


                                  Conceito abstrato de objeto…
  Conceito melhorado de keys…
                               Maior facilidade na abstração…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB




                                Orientado a objeto




                                        Exemplo de modelo OO …
CONCEITOS MATEMÁTICOS
 PARA ACESSO A DADOS
      BIOLÓGICOS
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS




Métodos de acesso…
                       Estruturas de dados que podem ser
                               armazenadas em memória.


          Utilizam SGBD`s e estruturas
        computacionais mais complexas.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS




                                            Hash Mapping


                 Conhecida como estrutura key-value…
   Armazena chave, valor e um ponteiro…
                         Alta performace em pesquisas id…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS




                                            Hash Mapping




                                                     Exemplo de hash…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS




                                  Árvore de Sufixos


              Utilizado por aplicações para pesquisa…
Resolve alguns problemas de similaridade…
                                     Alta performace em textos…
Matematicamente é…
F = {α1, α2, ..., αn}
F* = todas as sequências possíveis com o alfabeto F.
T E F*.
T = “TATA”
c = |T|

Logo:
T[i:j] (1≤ i≤ j≤ c)
T[1:j] = prefixo
T[i:c] = sufixo


                       Fórmula do prefixo e sufixo…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS




                                 Sufixo e Prefixo…

                                     Prefixos                    Sufixos
  R = “AGAGAT”                       R[1:1] = “A”                R[6:6] = “T”
                                     R[1:2] = “AG”               R[5:6] = “AT”
  |R| = 6
                                     R[1:3] = “AGA”              R[4:6] = “GAT”
                                     R[1:4] = “AGAG”             R[3:6] = “AGAT”
                                     R[1:5] = “AGAGA”            R[2:6] = “GAGAT”
                                     R[1:6] = “AGAGAT” R[1:6] = “AGAGAT”


                             Exemplo de prefixos e sufixos…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS




  Árvore de Sufixo…

R = “AGAGAT”
PRÁTICA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS




                            Visual Suffix Tree…

 Software para criação de suffix trees…

                       Linguagem Java utilizando o jGraph
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS




                            Visual Suffix Tree…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA




                                           HIV Databases
     • No HIV Databases estam armazenados dados de sequências
     de HIV, epitopos e testes para vacinas.
     • Este projeto foi fundado pela Division of AIDS of the National
     Institute of Allergy and Infectious Diseases (NIAID)
     • Acesso disponível pelo link:
         http://www.hiv.lanl.gov/content/index
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA




 UNIPROT

 • Banco de dados de proteínas e informações
 funcionais.
 • O UNIPROT é um consórcio entre:
       •    European Bioinformatics Institute (EBI).
       •    Swiss Institute of Bioinformatics (SIB).
       •    Protein Information Resource (PIR).
 • Esse banco de dados integrou quatro bancos de
 dados em 2002. Swiss-Prot e TrEMBL (EBI e SIB)
 e PIR-PSD e iProClass (PIR).
 • Acesso disponível pelo link:
     http://www.uniprot.org/
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA




 PROTEIN DATA BANK

 • É um repositório de estruturas tri-dimensionais de proteínas e
 ácidos nucléicos.
 • A maioria das estruturas foram obtidas por cristalograma ou por
 espectroscopia por ressonância magnética.
 • A estrutura pode ser visualizada em 3D.
 • Acesso disponível pelo link: http://www.rcsb.org/pdb
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA




 ENTREZ

 • O NCBI alberga dados provenientes da sequenciação de genomas
 no seu GenBank e mantém um índice de artigos de investigação
 biomédica que disponibiliza nas bases de dados PubMed Central e
 PubMed.
 • Todas as bases de dados estão disponíveis na Internet através do
 motor de busca Entrez. É um grande integrador de dados no NCBI.
 • Acesso disponível pelo link: http://www.ncbi.nlm.nih.gov/sites/
 gquery
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – REFERÊNCIAS



 1. Xiong, J. (2006). Essential Bioinformatics. Cambridge University
    Press.
 2. Andrzej Polanski and Marek Kimmel (1998). Bioinformatics.
    Springer.
 3. Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland,
    T. N. Bhat, Helge Weissig, Ilya N. Shindyalov and Philip E. Bourne
    (2000). The Protein Data Bank. Oxford University Press, Nucleic
    Acids Research, 2000, Vol. 28, No. 1
 4. Robert Schleif, (1993). Genetics and Molecular Biology.
    Department of Biology The Johns Hopkins University Baltimore,
    Maryland. All rights reserved. Printed in the United States of
    America on acid-free paper.
 5. Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith
    Roberts and Peter Walter, (2008). Molecular biology of the cell.
    Published by Garland science, Taylor & Francis Group, LLC, an
    informa business, 270 Madison Avenue, NewYork NY f
    0016,USA,and 2 park Square,Milton park, Abingdon,OXl4
    4RN,UK.
Perguntas !?
Obrigado !

Mais conteúdo relacionado

Último

Os editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxOs editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptx
TailsonSantos1
 
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdfGEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
RavenaSales1
 
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdfReta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
WagnerCamposCEA
 
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptxResponde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
AntonioVieira539017
 
matematica aula didatica prática e tecni
matematica aula didatica prática e tecnimatematica aula didatica prática e tecni
matematica aula didatica prática e tecni
CleidianeCarvalhoPer
 

Último (20)

Nós Propomos! Autocarros Elétricos - Trabalho desenvolvido no âmbito de Cidad...
Nós Propomos! Autocarros Elétricos - Trabalho desenvolvido no âmbito de Cidad...Nós Propomos! Autocarros Elétricos - Trabalho desenvolvido no âmbito de Cidad...
Nós Propomos! Autocarros Elétricos - Trabalho desenvolvido no âmbito de Cidad...
 
Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!
 
migração e trabalho 2º ano.pptx fenomenos
migração e trabalho 2º ano.pptx fenomenosmigração e trabalho 2º ano.pptx fenomenos
migração e trabalho 2º ano.pptx fenomenos
 
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
 
PROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdf
PROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdfPROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdf
PROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdf
 
Os editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxOs editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptx
 
Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)
 
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIAPROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
 
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMPRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
 
Jogo de Rimas - Para impressão em pdf a ser usado para crianças
Jogo de Rimas - Para impressão em pdf a ser usado para criançasJogo de Rimas - Para impressão em pdf a ser usado para crianças
Jogo de Rimas - Para impressão em pdf a ser usado para crianças
 
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
 
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdfGEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
 
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdfPROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
 
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdfReta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
 
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfProjeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
 
aula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.pptaula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.ppt
 
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptxResponde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
 
matematica aula didatica prática e tecni
matematica aula didatica prática e tecnimatematica aula didatica prática e tecni
matematica aula didatica prática e tecni
 

Destaque

Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Destaque (20)

AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 

[INTERCULTE2012] Introdução a Banco de Dados Biológicos

  • 1. INTRODUÇÃO A BANCOS DE DADOS BIOLÓGICOS FELIPE GUIMARÃES TORRES COORDENADO PELO PROF. MÁRCIO SOUSSA NÚCLEO DE SERVIÇOS TECNOLÓGICOS - NST
  • 2. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONTATO FELIPE GUIMARÃES TORRES fgtorres18@gmail.com http://www.facebook.com/felipe.g.torres.5 http://www.twitter.com/felipegtorres http://www.slideshare.net/fgtorres
  • 3.
  • 4. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – AGENDA 9.  Conceitos mate- 1.  Biologia Básica máticos. 2.  Seres vivos 10. Prática. 3.  Células 11. TecJorge. 4.  DNA 12. Referências. 5.  História do con- ceito de BDB. 6.  Evolução de Re- curso. 7.  Bancos de Dados Biológicos 8.  Arquitetura com- putacional de um BDB.
  • 6. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
  • 7. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Seres vivos… Seres formados por células… Exceção dos vírus…
  • 8. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Células
  • 9. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA NOME DO CURSO – NOME DO BLOCO Procarióticas…
  • 10. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Eucarióticas…
  • 11. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
  • 12. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Ácido desoxirribonucléico. Armazena informações genéticas em genes. São formados por monômeros conhecidos como nucleotídeos.
  • 13. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
  • 14. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Estrutura nucleotídica …
  • 15. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Relações entre nucleotídeos…
  • 16. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Estrutura do DNA
  • 17. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Ligações entre nucleotídeos Fosfodiéster…
  • 18. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Ligações entre nucleotídeos Pontes de Hidrogênio…
  • 19. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA Dogma central…
  • 21. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S 1982 1970 1965
  • 22. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S Década de 60…
  • 23. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S Tempo 13 anos (1990 - 2003) Custo U$3.8 bilhões
  • 24. INTRODUÇÃO BANCO DE D. B. ESTRUT. COMP. DADOS BIO. BANCO DE DADOS ATUAIS FERRAMENTAS
  • 25. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S
  • 26. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S ILLUMINA HISEQ2000 SANGER TOTAL DE BASES: 35 ~ 200 Gb TEMPO DA CORRIDA: 1.5 a 8 dias TOTAL DE BASES: 30~ 350 kb CUSTO: MENOS DE U$1/Mb TEMPO DA CORRIDA: 15 HORAS CUSTO: U$1000/Mb
  • 27. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GENBANK ENTRE 1995 A 2011.
  • 28. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GOLD ENTRE 1997 A 2011.
  • 29. BANCOS DE DADOS BIOLÓGICOS
  • 30. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS Banco de dados biológicos são locais computacionais para o armazenamento de dados biológicos.
  • 31. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS Dados Biológicos Sequências de DNA… Sequências de Proteínas… Anotações…
  • 32. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS Tipos de BDB Primários… Secundários… Especializados…
  • 33. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS Primários… Armazenam informações biológicas originais. Armazenam normalmente em arquivos de texto. Ex.: Fasta.
  • 34. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS Secundários… Armazenam resultados de análises feitas a partir de dados primários. Utilizam SGBD`s e estruturas computacionais mais complexas.
  • 36. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB Modelos de BD Arquivo de texto…. Relacional… Orientado a objeto….
  • 37. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB Relacional Planilhas que se relacionam… Utilizando o conceito de keys… Largamente utilizado e estável…
  • 38. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB Relacional Exemplo de modelo relacional…
  • 39. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB OO Conceito abstrato de objeto… Conceito melhorado de keys… Maior facilidade na abstração…
  • 40. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB Orientado a objeto Exemplo de modelo OO …
  • 41. CONCEITOS MATEMÁTICOS PARA ACESSO A DADOS BIOLÓGICOS
  • 42. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS Métodos de acesso… Estruturas de dados que podem ser armazenadas em memória. Utilizam SGBD`s e estruturas computacionais mais complexas.
  • 43. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS Hash Mapping Conhecida como estrutura key-value… Armazena chave, valor e um ponteiro… Alta performace em pesquisas id…
  • 44. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS Hash Mapping Exemplo de hash…
  • 45. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS Árvore de Sufixos Utilizado por aplicações para pesquisa… Resolve alguns problemas de similaridade… Alta performace em textos…
  • 46. Matematicamente é… F = {α1, α2, ..., αn} F* = todas as sequências possíveis com o alfabeto F. T E F*. T = “TATA” c = |T| Logo: T[i:j] (1≤ i≤ j≤ c) T[1:j] = prefixo T[i:c] = sufixo Fórmula do prefixo e sufixo…
  • 47. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS Sufixo e Prefixo… Prefixos Sufixos R = “AGAGAT” R[1:1] = “A” R[6:6] = “T” R[1:2] = “AG” R[5:6] = “AT” |R| = 6 R[1:3] = “AGA” R[4:6] = “GAT” R[1:4] = “AGAG” R[3:6] = “AGAT” R[1:5] = “AGAGA” R[2:6] = “GAGAT” R[1:6] = “AGAGAT” R[1:6] = “AGAGAT” Exemplo de prefixos e sufixos…
  • 48. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS Árvore de Sufixo… R = “AGAGAT”
  • 50. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS Visual Suffix Tree… Software para criação de suffix trees… Linguagem Java utilizando o jGraph
  • 51. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS Visual Suffix Tree…
  • 52. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA HIV Databases • No HIV Databases estam armazenados dados de sequências de HIV, epitopos e testes para vacinas. • Este projeto foi fundado pela Division of AIDS of the National Institute of Allergy and Infectious Diseases (NIAID) • Acesso disponível pelo link: http://www.hiv.lanl.gov/content/index
  • 53. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA UNIPROT • Banco de dados de proteínas e informações funcionais. • O UNIPROT é um consórcio entre: •  European Bioinformatics Institute (EBI). •  Swiss Institute of Bioinformatics (SIB). •  Protein Information Resource (PIR). • Esse banco de dados integrou quatro bancos de dados em 2002. Swiss-Prot e TrEMBL (EBI e SIB) e PIR-PSD e iProClass (PIR). • Acesso disponível pelo link: http://www.uniprot.org/
  • 54. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA PROTEIN DATA BANK • É um repositório de estruturas tri-dimensionais de proteínas e ácidos nucléicos. • A maioria das estruturas foram obtidas por cristalograma ou por espectroscopia por ressonância magnética. • A estrutura pode ser visualizada em 3D. • Acesso disponível pelo link: http://www.rcsb.org/pdb
  • 55. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA ENTREZ • O NCBI alberga dados provenientes da sequenciação de genomas no seu GenBank e mantém um índice de artigos de investigação biomédica que disponibiliza nas bases de dados PubMed Central e PubMed. • Todas as bases de dados estão disponíveis na Internet através do motor de busca Entrez. É um grande integrador de dados no NCBI. • Acesso disponível pelo link: http://www.ncbi.nlm.nih.gov/sites/ gquery
  • 56. INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – REFERÊNCIAS 1. Xiong, J. (2006). Essential Bioinformatics. Cambridge University Press. 2. Andrzej Polanski and Marek Kimmel (1998). Bioinformatics. Springer. 3. Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, T. N. Bhat, Helge Weissig, Ilya N. Shindyalov and Philip E. Bourne (2000). The Protein Data Bank. Oxford University Press, Nucleic Acids Research, 2000, Vol. 28, No. 1 4. Robert Schleif, (1993). Genetics and Molecular Biology. Department of Biology The Johns Hopkins University Baltimore, Maryland. All rights reserved. Printed in the United States of America on acid-free paper. 5. Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts and Peter Walter, (2008). Molecular biology of the cell. Published by Garland science, Taylor & Francis Group, LLC, an informa business, 270 Madison Avenue, NewYork NY f 0016,USA,and 2 park Square,Milton park, Abingdon,OXl4 4RN,UK.