¸˜
Introducao        Objetivos         Metodologia                             ˜
                                                        Resultados e Discussao          ˜
                                                                                 Conclusao




               ´                           ´
             Analise de propriedades topologicas das
                        ´                        ´
             redes biologicas integradas da bacteria
                  Escherichia coli e da levedura
                    Saccharomyces cerevisiae

                               Tiago Felipe Andrade
                          Orientador: Prof. Dr. Ney Lemke

                              Departamento de F´sica e Biof´sica
                                               ı           ı
                                       IBB-UNESP
                                       Apoio: CNPq


                                            2008
¸˜
Introducao         Objetivos   Metodologia                       ˜
                                             Resultados e Discussao          ˜
                                                                      Conclusao




   ´
Sumario


      1             ¸˜
             Introducao

      2      Objetivos

      3      Metodologia

      4                          ˜
             Resultados e Discussao

      5             ˜
             Conclusao
¸˜
Introducao         Objetivos   Metodologia                       ˜
                                             Resultados e Discussao          ˜
                                                                      Conclusao




   ´
Sumario


      1             ¸˜
             Introducao

      2      Objetivos

      3      Metodologia

      4                          ˜
             Resultados e Discussao

      5             ˜
             Conclusao
¸˜
Introducao        Objetivos        Metodologia                       ˜
                                                 Resultados e Discussao          ˜
                                                                          Conclusao




       ¸˜
Introducao




                          ˆ
             Biologia sistemica;
             Grafo ou rede;
¸˜
Introducao   Objetivos   Metodologia                       ˜
                                       Resultados e Discussao          ˜
                                                                Conclusao




Grafo
¸˜
Introducao        Objetivos        Metodologia                       ˜
                                                 Resultados e Discussao          ˜
                                                                          Conclusao




       ¸˜
Introducao




                          ˆ
             Biologia sistemica;
             Grafo ou rede;
                        ´
             Redes biologicas integradas;
¸˜
Introducao   Objetivos   Metodologia                       ˜
                                       Resultados e Discussao          ˜
                                                                Conclusao




         ´
Rede biologica integrada
¸˜
Introducao        Objetivos        Metodologia                       ˜
                                                 Resultados e Discussao          ˜
                                                                          Conclusao




       ¸˜
Introducao




                          ˆ
             Biologia sistemica;
             Grafo ou rede;
                        ´
             Redes biologicas integradas;
                                 ¸˜
             Modelos de classificacao;
¸˜
Introducao   Objetivos   Metodologia                       ˜
                                       Resultados e Discussao          ˜
                                                                Conclusao




                    ¸˜
Modelos de classificacao
¸˜
Introducao        Objetivos        Metodologia                       ˜
                                                 Resultados e Discussao          ˜
                                                                          Conclusao




       ¸˜
Introducao




                          ˆ
             Biologia sistemica;
             Grafo ou rede;
                        ´
             Redes biologicas integradas;
                                 ¸˜
             Modelos de classificacao;
                               ´
             Propriedades topologicas.
¸˜
Introducao        Objetivos    Metodologia                       ˜
                                             Resultados e Discussao          ˜
                                                                      Conclusao




                  ´
Propriedades topologicas




             Grau de conectividade, P(k);
                                            ´
             Coeficiente de agrupamento medio, C(k);
                               ¸˜
             Grau de intermediacao, CB (k).
¸˜
Introducao         Objetivos   Metodologia                       ˜
                                             Resultados e Discussao          ˜
                                                                      Conclusao




   ´
Sumario


      1             ¸˜
             Introducao

      2      Objetivos

      3      Metodologia

      4                          ˜
             Resultados e Discussao

      5             ˜
             Conclusao
¸˜
Introducao        Objetivos      Metodologia                         ˜
                                                 Resultados e Discussao          ˜
                                                                          Conclusao




Objetivos



                                    ´
             Construir as redes biologicas integradas da E. coli e da S.
             cerevisiae e;

                   ´          ´         ¸˜              ¸˜       ˆ
             analisa-las atraves da medicao e interpretacao de tres
                ˆ              ´
             parametros topologicos:

                            ¸˜
                 a distribuicao de conectividades, o coeficiente de
                                  ´
                 agrupamento medio e o grau de intermediacao.¸˜
¸˜
Introducao         Objetivos   Metodologia                       ˜
                                             Resultados e Discussao          ˜
                                                                      Conclusao




   ´
Sumario


      1             ¸˜
             Introducao

      2      Objetivos

      3      Metodologia

      4                          ˜
             Resultados e Discussao

      5             ˜
             Conclusao
¸˜
Introducao        Objetivos    Metodologia                       ˜
                                             Resultados e Discussao          ˜
                                                                      Conclusao




Metodologia




             Bancos de dados

                  ¸˜                     ´
             Definicoes propriedades topologicas

                       ¸˜
             Implementacao
¸˜
Introducao               Objetivos       Metodologia                             ˜
                                                             Resultados e Discussao          ˜
                                                                                      Conclusao




Bancos de dados


                                            ´
      Tabela: Lista dos bancos de dados biologicos utilizados para o
                         ¸˜
      processo de aquisicao dos dados.
        Banco de dados                     ¸˜
                                     Interacao                         ˆ
                                                                  Referencia
             BIGG1                     Meta             http://bigg.ucsd.edu/home.pl
         YEASTRACT1                    Trans              http://www.yeastract.com
           BIOGRID1                     PPI               http://www.thebiogrid.org
            KEGG2                      Meta              http://www.genome.jp/kegg
          RegulonDB2                   Trans           http://regulondb.ccg.unam.mx
        Bacteriome.org2                 PPI              http://www.bacteriome.org


             1
                             `
                 Relacionado a levedura S. cerevisiae.
             2
                             `     ´
                 Relacionado a bacteria E. coli.
¸˜
Introducao     Objetivos     Metodologia                             ˜
                                                 Resultados e Discussao          ˜
                                                                          Conclusao




         ¸˜
Distribuicao de conectividades - P(k )



                                                         ˜
      Calcula o numero total de nodos com grau k de conexao.
                 ´
      Representada matematicamente por:

                           P(k) =                     1                   (1)
                                    v ∈V |deg(v )=k

             ´
      onde v e um nodo do grupo de nodos V pertencentes ao grafo,
                ´
      e deg(v ) e o grau do nodo v .
                                                        ˜
      Ainda caracteriza a rede como livre de escala ou nao.
¸˜
Introducao      Objetivos    Metodologia                             ˜
                                                 Resultados e Discussao          ˜
                                                                          Conclusao




                           ´
Coeficiente de agrupamento medio - C(k )


                                      ˜     ´
      Caracteriza a densidade de conexoes proxima a um
                         ´
      determinado nodo. E dado por:

                                         2y
                              Ci =                                        (2)
                                      z(z − 1)

      onde z e o no de nodos primeiros vizinhos e y e o no total de
              ´   .                                 ´    .
          ¸˜
      ligacoes que conectam nodos primeiros vizinhos.

                               C(k ) = Ci (k )                            (3)

                      ´     ´
      Defini se a rede e hierarquica, ou seja, se o agrupamento dos
      nodos depende da conectividade dos mesmos.
¸˜
Introducao      Objetivos     Metodologia                                ˜
                                                     Resultados e Discussao          ˜
                                                                              Conclusao




                  ¸˜
Grau de intermediacao - CB (k )



                   ¸˜
      Calcula a fracao dos trajetos mais curtos que incluem um nodo
         ´ a medida de relevancia de um nodo, dada por:
      v. E                   ˆ

                                                 σst (v )
                            CB (v ) =                                         (4)
                                                  σst
                                        s=v =t

                    ´                                         ´
      onde σst (v ) e o numero de trajetos mais curtos de s ate t que
                           ´
      inclui v e σst e´ o numero de trajetos de s ate t.
                             ´                      ´
¸˜
Introducao        Objetivos    Metodologia                        ˜
                                              Resultados e Discussao          ˜
                                                                       Conclusao




          ¸˜
Implementacao




             Mathematica R e Python
             Combinatorica, GraphUtilities e NetworkX
¸˜
Introducao         Objetivos   Metodologia                       ˜
                                             Resultados e Discussao          ˜
                                                                      Conclusao




   ´
Sumario


      1             ¸˜
             Introducao

      2      Objetivos

      3      Metodologia

      4                          ˜
             Resultados e Discussao

      5             ˜
             Conclusao
¸˜
Introducao         Objetivos     Metodologia                         ˜
                                                 Resultados e Discussao          ˜
                                                                          Conclusao




          ´
Redes biologicas integradas



             E. coli
                  organismo procarionte;
                  rede integrada possui ≈ 2.400 genes que realizam
                  ≈ 23.000 interacoes.
                                 ¸˜
             S. cerevisae
                  organismo eucarionte;
                  rede integrada possui ≈ 6.000 genes que realizam
                  ≈ 80.000 interacoes.
                                 ¸˜
¸˜
Introducao   Objetivos   Metodologia                       ˜
                                       Resultados e Discussao          ˜
                                                                Conclusao




Grafo da rede integrada da E. coli
¸˜
Introducao        Objetivos   Metodologia                       ˜
                                            Resultados e Discussao          ˜
                                                                     Conclusao




P(k) - E. coli




      y = αx −β
¸˜
Introducao      Objetivos   Metodologia                       ˜
                                          Resultados e Discussao          ˜
                                                                   Conclusao




P(k) - S. cerevisiae




      y = αx −β eγx
¸˜
Introducao     Objetivos   Metodologia                       ˜
                                         Resultados e Discussao          ˜
                                                                  Conclusao




C(k) - E. coli




                    2
      y = αeβx−γx
¸˜
Introducao     Objetivos   Metodologia                       ˜
                                         Resultados e Discussao          ˜
                                                                  Conclusao




C(k) - S. cerevisiae




                    2
      y = αeβx−γx
¸˜
Introducao       Objetivos   Metodologia                       ˜
                                           Resultados e Discussao          ˜
                                                                    Conclusao




            ´
CB (k ) - Analise comparativa




      y = αx β
¸˜
Introducao   Objetivos   Metodologia                       ˜
                                       Resultados e Discussao          ˜
                                                                Conclusao




    ¸˜
Equacoes de ajuste
¸˜
Introducao         Objetivos   Metodologia                       ˜
                                             Resultados e Discussao          ˜
                                                                      Conclusao




   ´
Sumario


      1             ¸˜
             Introducao

      2      Objetivos

      3      Metodologia

      4                          ˜
             Resultados e Discussao

      5             ˜
             Conclusao
¸˜
Introducao        Objetivos      Metodologia                       ˜
                                               Resultados e Discussao          ˜
                                                                        Conclusao




       ˜
Conclusao


      E. coli
         1   Livre de escala
         2                ´
             Linear quadratica
         3             ¸˜             ˆ
             Intermediacao: lei de potencia

      S. cerevisiae
         1   Livre de escala diferenciada
         2                ´
             Linear quadratica
         3             ¸˜             ˆ
             Intermediacao: lei de potencia
¸˜
Introducao     Objetivos     Metodologia                       ˜
                                           Resultados e Discussao          ˜
                                                                    Conclusao




Perspectivas

                                              ´      ´ ´
      O novo modelo, definido como linear quadratico, e valido para
      outros organismos?

              Homo sapiens

              Mus musculus

              ´ ´       ´
      Ele tambem e aplicavel para outros tipos de redes?

              Internet

              Telefonia celular
¸˜
Introducao        Objetivos    Metodologia                       ˜
                                             Resultados e Discussao          ˜
                                                                      Conclusao




     ˜
Questoes




                               ¸˜
             Obrigado pela atencao !
¸˜
Introducao       Objetivos       Metodologia                             ˜
                                                     Resultados e Discussao          ˜
                                                                              Conclusao




Grau de proximidade - CC (k )




                                        ´ ´
      Mede quanto um nodo particular esta proximo de todos os
                            ´ definido como:
      outros nodos da rede. E
                                                 1
                             CC (v ) =                                        (5)
                                           t∈V /v dG (v , t)

                      ´       ˆ
      onde dG (v , t) e a distancia entre v e t.
¸˜
Introducao       Objetivos   Metodologia                       ˜
                                           Resultados e Discussao          ˜
                                                                    Conclusao




           ´
CC (k) - Analise comparativa




      y = αx β

IC Presentation on Biological Networks - Bioinformatics

  • 1.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ ´ Analise de propriedades topologicas das ´ ´ redes biologicas integradas da bacteria Escherichia coli e da levedura Saccharomyces cerevisiae Tiago Felipe Andrade Orientador: Prof. Dr. Ney Lemke Departamento de F´sica e Biof´sica ı ı IBB-UNESP Apoio: CNPq 2008
  • 2.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Sumario 1 ¸˜ Introducao 2 Objetivos 3 Metodologia 4 ˜ Resultados e Discussao 5 ˜ Conclusao
  • 3.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Sumario 1 ¸˜ Introducao 2 Objetivos 3 Metodologia 4 ˜ Resultados e Discussao 5 ˜ Conclusao
  • 4.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ¸˜ Introducao ˆ Biologia sistemica; Grafo ou rede;
  • 5.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao Grafo
  • 6.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ¸˜ Introducao ˆ Biologia sistemica; Grafo ou rede; ´ Redes biologicas integradas;
  • 7.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Rede biologica integrada
  • 8.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ¸˜ Introducao ˆ Biologia sistemica; Grafo ou rede; ´ Redes biologicas integradas; ¸˜ Modelos de classificacao;
  • 9.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ¸˜ Modelos de classificacao
  • 10.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ¸˜ Introducao ˆ Biologia sistemica; Grafo ou rede; ´ Redes biologicas integradas; ¸˜ Modelos de classificacao; ´ Propriedades topologicas.
  • 11.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Propriedades topologicas Grau de conectividade, P(k); ´ Coeficiente de agrupamento medio, C(k); ¸˜ Grau de intermediacao, CB (k).
  • 12.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Sumario 1 ¸˜ Introducao 2 Objetivos 3 Metodologia 4 ˜ Resultados e Discussao 5 ˜ Conclusao
  • 13.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao Objetivos ´ Construir as redes biologicas integradas da E. coli e da S. cerevisiae e; ´ ´ ¸˜ ¸˜ ˆ analisa-las atraves da medicao e interpretacao de tres ˆ ´ parametros topologicos: ¸˜ a distribuicao de conectividades, o coeficiente de ´ agrupamento medio e o grau de intermediacao.¸˜
  • 14.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Sumario 1 ¸˜ Introducao 2 Objetivos 3 Metodologia 4 ˜ Resultados e Discussao 5 ˜ Conclusao
  • 15.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao Metodologia Bancos de dados ¸˜ ´ Definicoes propriedades topologicas ¸˜ Implementacao
  • 16.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao Bancos de dados ´ Tabela: Lista dos bancos de dados biologicos utilizados para o ¸˜ processo de aquisicao dos dados. Banco de dados ¸˜ Interacao ˆ Referencia BIGG1 Meta http://bigg.ucsd.edu/home.pl YEASTRACT1 Trans http://www.yeastract.com BIOGRID1 PPI http://www.thebiogrid.org KEGG2 Meta http://www.genome.jp/kegg RegulonDB2 Trans http://regulondb.ccg.unam.mx Bacteriome.org2 PPI http://www.bacteriome.org 1 ` Relacionado a levedura S. cerevisiae. 2 ` ´ Relacionado a bacteria E. coli.
  • 17.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ¸˜ Distribuicao de conectividades - P(k ) ˜ Calcula o numero total de nodos com grau k de conexao. ´ Representada matematicamente por: P(k) = 1 (1) v ∈V |deg(v )=k ´ onde v e um nodo do grupo de nodos V pertencentes ao grafo, ´ e deg(v ) e o grau do nodo v . ˜ Ainda caracteriza a rede como livre de escala ou nao.
  • 18.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Coeficiente de agrupamento medio - C(k ) ˜ ´ Caracteriza a densidade de conexoes proxima a um ´ determinado nodo. E dado por: 2y Ci = (2) z(z − 1) onde z e o no de nodos primeiros vizinhos e y e o no total de ´ . ´ . ¸˜ ligacoes que conectam nodos primeiros vizinhos. C(k ) = Ci (k ) (3) ´ ´ Defini se a rede e hierarquica, ou seja, se o agrupamento dos nodos depende da conectividade dos mesmos.
  • 19.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ¸˜ Grau de intermediacao - CB (k ) ¸˜ Calcula a fracao dos trajetos mais curtos que incluem um nodo ´ a medida de relevancia de um nodo, dada por: v. E ˆ σst (v ) CB (v ) = (4) σst s=v =t ´ ´ onde σst (v ) e o numero de trajetos mais curtos de s ate t que ´ inclui v e σst e´ o numero de trajetos de s ate t. ´ ´
  • 20.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ¸˜ Implementacao Mathematica R e Python Combinatorica, GraphUtilities e NetworkX
  • 21.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Sumario 1 ¸˜ Introducao 2 Objetivos 3 Metodologia 4 ˜ Resultados e Discussao 5 ˜ Conclusao
  • 22.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Redes biologicas integradas E. coli organismo procarionte; rede integrada possui ≈ 2.400 genes que realizam ≈ 23.000 interacoes. ¸˜ S. cerevisae organismo eucarionte; rede integrada possui ≈ 6.000 genes que realizam ≈ 80.000 interacoes. ¸˜
  • 23.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao Grafo da rede integrada da E. coli
  • 24.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao P(k) - E. coli y = αx −β
  • 25.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao P(k) - S. cerevisiae y = αx −β eγx
  • 26.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao C(k) - E. coli 2 y = αeβx−γx
  • 27.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao C(k) - S. cerevisiae 2 y = αeβx−γx
  • 28.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ CB (k ) - Analise comparativa y = αx β
  • 29.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ¸˜ Equacoes de ajuste
  • 30.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ Sumario 1 ¸˜ Introducao 2 Objetivos 3 Metodologia 4 ˜ Resultados e Discussao 5 ˜ Conclusao
  • 31.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ˜ Conclusao E. coli 1 Livre de escala 2 ´ Linear quadratica 3 ¸˜ ˆ Intermediacao: lei de potencia S. cerevisiae 1 Livre de escala diferenciada 2 ´ Linear quadratica 3 ¸˜ ˆ Intermediacao: lei de potencia
  • 32.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao Perspectivas ´ ´ ´ O novo modelo, definido como linear quadratico, e valido para outros organismos? Homo sapiens Mus musculus ´ ´ ´ Ele tambem e aplicavel para outros tipos de redes? Internet Telefonia celular
  • 33.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ˜ Questoes ¸˜ Obrigado pela atencao !
  • 34.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao Grau de proximidade - CC (k ) ´ ´ Mede quanto um nodo particular esta proximo de todos os ´ definido como: outros nodos da rede. E 1 CC (v ) = (5) t∈V /v dG (v , t) ´ ˆ onde dG (v , t) e a distancia entre v e t.
  • 35.
    ¸˜ Introducao Objetivos Metodologia ˜ Resultados e Discussao ˜ Conclusao ´ CC (k) - Analise comparativa y = αx β