SlideShare uma empresa Scribd logo
1 de 56
Baixar para ler offline
Cátedra de genética

Universidad Nacional Autónoma de Colombia
               Sede Bogotá
 (r)evolución de información en biología:
          el caso de la genómica

          Layla Michán
Departamento de Biología Evolutiva,
   Facultad de Ciencias, UNAM
PROBLEMAS
             1. (R)evolución digital en las ciencias biológicas
             2. Características de la E-biología
             3. Dinámica, estructura y relaciones de la biología reciente
             4. Publicación científica
             5. Recursos web y ciberinfraestructura para biología
             6. Colecciones de datos
             7. Meta-análisis de literatura: bibliometría, análisis de redes,
             minería de textos, semántica


      TIPOS
1.Biológica
                                                                                         ENFOQUES
                                                                                 1.Biología
2.Bibliográfica                                                                  2.Ciencias de la información y
3.Institucional                             INFORMACIÓN                          documentación
                                                                                 3.Tecnologías de la
      ÁREAS                                   BIOLÓGICA                          Información y comunicación
  1.Biodiversidad                                                                4.Ciencias de la computación
  2.Biomedicina



                                             APLICACIONES
                  1.Obtención de nuevo conocimiento (Biología)
                  2.Análisis de la ciencia actual (Bibliometría, Historia, Sociología)
                  3.Ciencias de la Información y la documentación biológica
                  4.Planeación, evaluación, gestión y política científica
Historia de la ciencias
                   Etapas
•   Antigüedad (III ac V d.c.)
•   Edad Media.(V-XIV)
•   Renacimiento (XV-XVI)
•   Etapa Moderna Temprana (XVII-XVIII)
•   Etapa Moderna (1800-1950)
•   Etapa Reciente o Contemporánea(1950-2010)
Historia Biología (Problemas)
Historia Natural (in vivo)
  – Siglo III A.C-XIX
                         Biología
                        Siglo XX (in vitro)
                         Molecularización

                                        Siglo XXI (in silico)
                                              Computarización
Los problemas de la Herencia Siglo XIX
• La biología es una rama del conocimiento derivada de la
  síntesis de diversas tradiciones científicas, sin duda la más
  importante es la Historia Natural pero durante el siglo XIX hubo
  otras quizás menos abundantes en cuanto a producción, pero
  igualmente relevantes en cuanto a las innovaciones
  conceptuales para la biología actual, entre estas están:
• La herencia que estudiaba como se transmiten los caracteres
  de los padres a los hijos con base en:
   – La de los criadores y mejoradores enfocados al estudio del
     mejoramiento (especialmente de plantas), es decir en la
     herencia de los caracteres importantes para el hombre
     (agronomía actual).
   – La de los hibridólogos encargados de estudiar la herencia
     de caracteres y la naturaleza de la especie (esencialista y
     nominalista) iniciada con Linneo.
• Había dos formas de estudiar la herencia de caracteres:
   – Los arboles genealógicos o pedigrís.
   – Cruzas entre individuos con distintos caracteres
Gregor Mendel (1822-1884)
•   En 1900 se redescubrió el trabajo de Gregor Mendel, quien en 1865 había
    anunciado el resultado de sus estudios con chícharos ante la Sociedad
    Bruniana.
•   Los principales postulados de sus experimentos fueron:
     – Ciertos caracteres que pueden distinguirse fácilmente muestran
       predominancia de unos sobre otros en la progenie de la cruza de padres
       con caracteres opuestos o diferenciados.
     – Dos caracteres son transmitidos como elementos diferentes, uno del padre
       y otro de la madre, en donde uno es dominante y el otro recesivo . Los
       caracteres que se transmiten y aparecen en la primera generación son los
       dominantes y los que permanecen ocultos o de forma latente en el proceso
       son los recesivos.
•   Mendel usó la expresión recesivo porque estos caracteres desaparecen en la
    primera generación, pero reaparecen en las subsecuentes.
•   Reconoció que esos pares actúan independientemente de otros pares de
    caracteres.
•   De estos dos principios derivó algunas reglas aritméticas que rigen la herencia
Para progenies de híbridos con un par de caracteres diferenciantes) R y r, su
proporción de la progenie será de tres dominantes contra un recesivo.
Cuando difieren en dos pares de caracteres la proporción será de 9:3:3:1.
Redescubrimiento de las leyes de Mendel

En 1900 de manera independiente publicaron los resultados de
  sus trabajos haciendo referencia al trabajo “precursor” de
  Mendel:
• El botánico holandés Hugo de Vries (1848-1935)
• El botánico alemán Carl Correns (1864-1933)
• El austríaco Eric Tschermak von Seysenegg (1871-1962)
Este hecho marcó el inicio del estudio de la genética se
  extendieron y aplicaron los conocimientos mendelianos.
• Sólo Correns comprendió completamente el trabajo de Mendel
  y sus consecuencias. Tanto De Vries como Tschermak no
  entendían conceptos como dominancia y confundían en una
  las dos leyes de Mendel en una sola. Es entonces muy claro
  que el trabajo de Mendel no fue entendido ni en sus aspectos
  técnicos ni tampoco en su importancia. De hecho, el
  entendimiento de su relevancia vino antes de ser entendido
  técnicamente.
Tomas H. Morgan (1866-1945)




Teoría cromosómica de la herencia
Mapas cromosómicos
Herencia ligada al sexo
Nobel 1933
El término biología molecular fue acuñado por el Director de la
División de Ciencias Naturales de la fundación Rokefeller, Warren
Weaver, en 1938.




         Warren Weaver                     Warren Weaver Hall
          (1894-1978)                         Washington
Hechos históricos   http://www.nature.com/nature/journal/v422/n6934/pdf/tim
                                        eline_01626.pdf
James Watson y Francis Crick
    Premio Nobel 1962
1990: TICS Y BIOLOGÍA
La sociedad del conocimiento
• Se refiere al incremento espectacular y a la
  aceleración sin precedente del ritmo de creación,
  acumulación, distribución y aprovechamiento de
  la información y el conocimiento.
-El conocimiento se crea, se acumula, se difunde y
  se aprovecha, pues orienta las decisiones y
  permite la intervención en el mundo, de acuerdo
  con ciertos fines y valores (Morales, 2001).
• El modelo de la Sociedad del Conocimiento está
  en construcción al igual que la sociedad misma
  (Olivé, 2005).
(Re)evolución de la información (1990)
• Diseño de las computadoras.
• Aparición del Internet
• Masificación de la web.
• Formato digital: bajo costo, poco espacio.
• Explosión de la información.
• Gran cantidad de colecciones de datos .
• Dinámica: cambia, está en modificación constante, tanto el
  contenido como los formatos.
• Masiva
• Aplicaciones de mata-análisis
(Re)evolución de la información (científica)
• La adopción del formato electrónico.
• Producción acelerada de una gran variedad de programas, aplicaciones,
  herramientas, utilidades recursos y servicios electrónicos para la práctica
  científica, muchos de ellos disponibles a través de la Internet.
• Uso de la Web como medio de comunicación.
• El número de los investigadores y de sus publicaciones se duplica
  aproximadamente cada veinte años.
• Viven actualmente entre un 80% y un 90% de los científicos que han existido.
• Se publican cada año mas de dos millones de artículos.
• Se conceden un millón de patentes.
• Modificación en la forma de producir, evaluar y consultar la información.
   – Revistas electrónicas
   – Procedimiento electrónico
   – Evaluación libre
   – E-prints: Preprints y posprints
   – Inmediatez
• Se han producido nuevas disciplinas científicas
La transformación de la biología
•   Molecularización
•   Colaboración
•   Multidisciplinariedad
•   Proyectos internacionales
•   Grids
•   Nuevos modelos
•   Nuevas disciplinas
     –   Bioinformática
     –   Informática Médica
     –   Neuroinformática
     –   Biología de Sistemas
• Colecciones de datos
     – Biológicas
     – Bibliográficas
Investigación biológica

                         Descripción       Comparación

                   Observación Experimentación Clasificación


In vivo
In vitro (1900)
                        Investigación Científica
In Silico (1990)               (Biología)
3000                         Escherichia (94873)
                                         Drosophila (48989)
            2500                         Saccharomyces (27549)
                                         Arabidopsis (18094)
                                         Caenorhabditis (5353)
            2000
Documents




            1500


            1000


            500


              0
                   1900
                          1905
                                 1910
                                        1915
                                               1920
                                                      1925
                                                             1930
                                                                    1935
                                                                           1940
                                                                                  1945
                                                                                         1950
                                                                                                1955
                                                                                                       1960
                                                                                                              1965
                                                                                                                     1970
                                                                                                                            1975
                                                                                                                                   1980
                                                                                                                                          1985
                                                                                                                                                 1990
                                                                                                                                                        1995
                                                                                                                                                               2000
                                                                                                                                                                      2005
                                                                                  Year
250                    Zea (7636)
                                    Neurospora (6640)
                                    Dictyostelium (6191)
             200                    Chlamydomonas (5646)
                                    Schizosaccharomyces (3183)
                                    Danio (973)
             150
Documentos




             100



              50



               0
                   1900
                          1905
                                 1910
                                        1915
                                               1920
                                                      1925
                                                             1930
                                                                    1935
                                                                           1940
                                                                                  1945
                                                                                         1950
                                                                                                1955
                                                                                                       1960
                                                                                                              1965
                                                                                                                     1970
                                                                                                                            1975
                                                                                                                                   1980
                                                                                                                                          1985
                                                                                                                                                 1990
                                                                                                                                                        1995
                                                                                                                                                               2000
                                                                                                                                                                      2005
                                                                                  Year
706




                                                                                                                   Behavioral Scien
                                                                                                   782




                                                                                                                   Biotech & Microbio
                                                                                                 1200




                                                                                                                   Biophysics
                                                                                                 1231




                                                                                                                   Physiology
                                                                                                 1258




                                                                                                                   Toxicology
                                                                                                 1465




                                                                                                                   Entomology
                                                                                          1811
                                                                                   (2)
                                                                                         1258




                                                                                                                   Ecology
                                                                              2340
                                                                               (3)




                                                                                                                   Evolutionary Bio




                                                                                                                                                        Figure 21
                                                                                     2365




                                                                                                                   Zoology




                                                                                                                                         Subject Area
                                                                                    2482
                                                                             (2)




                                                                                                                   Biology
                                                                                    2519
                                                                         (1)

                                                                                                                   Neurosciences
                                                                      4310
                                                               (20)
                                                                                                                   Multidisciplinary
                                                        6328
                                                 (3)
                                                                                                                   Develop Bio
                                          8137
                                   (15)                                                                            Cell Bio
                           10907
                    (18)
                                                                                                                   Biochem & Mol Bio
17900
 (6)




                                                                                                                   Genetics & Heredity




                                                                                                              0%
                                                                                            5%
              30%


                       25%


                                    20%


                                                       15%
40%


        35%




                                                                       10%
                                   Documents
600
                                         Genetics & Heredity

                                         Biochemistry & Molecular Biology
            500
                                         Cell Biology

                                         Developmental Biology
            400                          Neuroscience
Documents




            300




            200




            100




              0
                  1905

                         1910

                                1915

                                       1920

                                              1925

                                                     1930

                                                            1935

                                                                   1940

                                                                          1945

                                                                                 1950

                                                                                        1955

                                                                                               1960

                                                                                                      1965

                                                                                                             1970

                                                                                                                    1975

                                                                                                                           1980

                                                                                                                                  1985

                                                                                                                                         1990

                                                                                                                                                1995

                                                                                                                                                       2000

                                                                                                                                                              2005
                                                                                   Year

                                                                             Figure 22
2005
                                                                                                     2000
                                                                                                     1995
                                                                                                     1990
                                                                                                     1985
                                                                                                     1980
                                                                                                     1975
                                                                                                     1970
                                                                                                     1965
                                                                                                     1960




                                                                                                                   Figure 23
                                                                                                            Year
                                                                                                     1955
                                                                                                     1950
                                                                                                     1945
      Evolutionary Biology




                                                                                                     1940
                                                                                                     1935
                                                      Toxicology




                                                                                                     1930
                                       Zoology
                             Ecology




                                                                                                     1925
                                                                                                     1920
                                                                                                     1915
                                                                                                     1910
                                                                                                     1905
100




                                80

                                                 70




                                                                        50

                                                                             40

                                                                                  30

                                                                                       20




                                                                                                 0
      90




                                                                   60




                                                                                            10
                                                                        Documents
Colección de
secuencias de
                E-ciencia
genes
                Ciberinfraestructura
Genbank
• Es una colección anotada de todas las secuencias de nucleótidos a
  disposición del público y su traducción de proteínas.
• Centro Nacional de Información Biotecnológica (NCBI)
• European Molecular Biology Laboratory (EMBL) de datos de
  Bibliotecas del Instituto Europeo de Bioinformática (EBI)
• DNA Data Bank de Japón (DDBJ).
• Reciben las secuencias producidas en laboratorios de todo el
  mundo de más de 100.000 organismos distintos.
• Crece a un ritmo exponencial, duplicando cada 10 meses. Suelte
  134, producido en febrero de 2003, contenía más de 29300
  millones de bases nucleotídicas en más de 23,0 millones de
  secuencias.
• Se construye mediante el envío directo de los distintos laboratorios
  y de los centros de secuenciación a gran escala.
http://www.ncbi.nlm.nih.gov/genbank/genbankstats.html
Olson M, Hood L, Cantor C,
Botstein D. A common
language for physical
mapping of the human
genome. Science. 1989; 245
(4925): 1434–
1435. [PubMed]
800.000
                                                     Documentos en PubMed (NIH)
700.000


600.000


500.000


400.000


300.000


200.000


100.000


     0
                 1870



                                      1885



                                                           1900



                                                                                1915



                                                                                                     1930



                                                                                                                          1945



                                                                                                                                               1960



                                                                                                                                                                    1975


                                                                                                                                                                                  1985
                                                                                                                                                                                         1990


                                                                                                                                                                                                       2000
                                                                                                                                                                                                              2005
          1865


                        1875
                               1880


                                             1890
                                                    1895


                                                                  1905
                                                                         1910


                                                                                       1920
                                                                                              1925


                                                                                                            1935
                                                                                                                   1940


                                                                                                                                 1950
                                                                                                                                        1955


                                                                                                                                                      1965
                                                                                                                                                             1970


                                                                                                                                                                           1980



                                                                                                                                                                                                1995
                                                              Cerca de 20 millones octubre, 2010)
e-science/ cyberinfraestructure
• cyberinfraestructure (USA)          • e-science (europe)
• United States National Science      • United Kingdom's Office of
  Foundation (NSF) blue-ribbon          Science and Technology in
  committee in 2003                     1999
• Describes the new research
                                      • Will refer to the large scale
  environments that support
  advanced data acquisition, data       science that will
  storage, data management, data        increasingly be carried out
  integration, data mining, data        through distributed global
  visualization and other computing     collaborations enabled by
  and information processing            the Internet
  services over the Internet
Ciberinfraestructura
•Entorno tecnológico-social que permite crear, difundir y
preservar los datos, información y conocimientos mediante
la adquisición, almacenamiento, gestión, integración,
informática, minería, visualización y otros servicios a través
de Internet (NSF 2003, 2007).
•Incluye un conjunto interoperable de diversos elementos:
   –1) Infraestructura, los sistemas computacionales (hardware,
   software y redes), servicios, instrumentos y herramientas.
   –2) Colecciones de datos.
   –3) Grupos virtuales de investigación (colaboratorios y
   observatorios).
e-investigación
•   Actividades de investigación que utilizan una gama de capacidades avanzadas de las TIC y abarca
    nuevas metodologías de investigación que salen de un mayor acceso a:

       * Las comunicaciones de banda ancha de redes, instrumentos de investigación y las
    instalaciones, redes de sensores y repositorios de datos;

       * Software y servicios de infraestructura que permitan garantizar la conectividad e
    interoperabilidad;

      * Aplicación herramientas que abarcan la disciplina de instrumentos específicos y herramientas
    de interacción.

    avanzar y aumentar, en lugar de reemplazar las tradicionales metodologías de investigación,
•   permitirá a los investigadores para llevar a cabo su labor de investigación más creativa, eficiente y
    colaboración a larga distancia y difundir sus resultados de la investigación con un mayor efecto.
•   Colaboración

    Nuevos campos de investigación emergentes, utilizando nuevas técnicas de minería de datos y el
    análisis, avanzados algoritmos computacionales y de redes de intercambio de recursos.
e-Science
•   Originally referred to experiments that connected together a few powerful
    computers located at different sites and, later, a very large number of modest PCs
    across the world in order to undertake enormous calculations or process huge
    amounts of data. The coordination of geographically dispersed computing and data
    resources has become known as the Grid. This is shorthand for the emerging
    standards and technology – hardware and software – being developed to enable
    and simplify the sharing of resources. The analogy is an electric power grid, which
    comprises numerous varied resources connected together to contribute power into
    a shared pool that users can easily access when they need it.

•   What is exciting about the Grid is that the combination of extensive connectivity,
    massive computer power and vast quantities of digitized data – all three of which
    are still rapidly expanding – making possible new applications that are orders of
    magnitude more potent than even a few years ago.

•   The term 'e-research' is sometimes used instead of 'e-science', with the advantage
    that gives more emphasis to the end result of better, richer, faster or new research
    results, rather than the technologies used to get them.

National Centre for e-Social Science. 2008. Frequently Asked Questions. Diponible en:
   http://www.ncess.ac.uk/about_eSS/faq/?q=General_1#General_1
E-ciencia (e-science)
• Resulta del uso y aplicación de la
  Ciberinfraestructura en la práctica cientifica,
• Se caracteriza por la inter y multidisciplinariedad.
• Colaboración, la participación de un gran número
  de investigadores (en algunos casos cientos)
  localizados en diversas regiones y con diferentes
  especialidades que se forman grupos trabajo (Hey y
  Trefethen, 2005; Barbera et al.,2009).
E-ciencia
Uno de los primeros proyectos de e-ciencia fue el de el genoma humano, se
  publicó en el 2001 en dos artículos con un día de diferencia en las revistas
  Nature y Science.

Nature:Initial sequencing and analysis of the human genome
  79 Autores
  48 Instituciones
181 referencias
  Todos los autores provenientes de departamentos de Ciencias Genómicas (o
  genética) exceptuando los siguientes:
  Department of Cellular and Structural Biology
  Department of Molecular Genetics
  Department of Molecular Biology

Science: The Sequence of the Human Genome
   276 Autores
   14 Instituciones
    452 referencias
   Todos los autores provenientes de departamentos de Ciencias Genómicas (o
   genética) exceptuando los siguientes: Department of Biology e Informática
   Médica
1865   Gregor Mendel descubre las leyes de la Genética                                   http://www.nature.com/nature/journal/v42

                                                                                         2/n6934/pdf /timeline_01626.pdf


1953   James Watson y Francis Crick describen la estructura de la doble-hélice del ADN   http://www.nature.com/nature/journal/v42

                                                                                         2/n6934/pdf /timeline_01626.pdf


1966   Marshall Nirenberg, Har Gobind Khorana y Robert Holley determinan el código http://www.nature.com/nature/journal/v42
                                                                                         2/n6934/pdf /timeline_01626.pdf
       genético

1972   Stanley Cohen and Herbert Boyer desarrollan la tecnología del ADN recombinante    http://www.nature.com/nature/journal/v42

                                                                                         2/n6934/pdf /timeline_01626.pdf


1977   Frederick Sanger, Allan Maxam y Walter Gilbert desarrollan métodos de http://www.nature.com/nature/journal/v42
                                                                                         2/n6934/pdf /timeline_01626.pdf
       secuenciación del ADN

1982   La base de datos „GenBank‟ es establecida                                         http://www.nature.com/nature/journal/v42

                                                                                         2/n6934/pdf /timeline_01626.pdf


1985   Es inventada la Reacción en Cadena de la Polimerasa (PCR)                         http://www.nature.com/nature/journal/v42

                                                                                         2/n6934/pdf /timeline_01626.pdf


1990   El Proyecto Genoma Humano (HGP) inicia en Estados Unidos                          http://www.nature.com/nature/journal/v42

                                                                                         2/n6934/pdf /timeline_01626.pdf


1997   El genoma de Escherichia coli es secuenciado                                      http://www.nature.com/nature/journal/v42

                                                                                         2/n6934/pdf /timeline_01626.pdf


2003   La secuencia del genoma humano es finalizada                                      http://www.nature.com/nature/journal/v42

                                                                                         2/n6934/pdf /timeline_01626.pdf
La Genómica
• Es el estudio sistemático de la documentación completa de
  las secuencias del ADN de los organismos (MeSH, 2010),
  dicho estudio ha ayudado a comprender polimorfismos
  dentro de las especies, la interacción de las proteínas y la
  evolución (Brent, 2000).
• Incluye todos los métodos que recopilan y analizan datos
  completos acerca de los genes, incluida las secuencias, la
  abundancia de los ácidos nucleicos y las propiedades de las
  proteínas que codifican (Murray, 2000).
• Nuestra capacidad para estudiar la función génica está
  aumentando en la especificidad gracias a esta nueva
  disciplina (Collins, et ál., 2003) que se compromete a
  acelerar el descubrimiento científico en todos los ámbitos de
  la ciencia biológica (Burley, 2000).
Número de Publicaciones
                3500
                        Pathology and
                        immunopathology
                3000    research en 1988; The
                        genomics of human
                        homeobox-containing
                2500    loci‟, escrito por CA
                        Ferguson-Smith y FH
                        Ruddle del
                        Departamento de
Publicaciones




                2000
                        Biología, en la
                        Universidad de Yale,
                1500    New Haven,
                        Connecticut.

                1000



                 500



                   0
                       1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
                                                                           Año
Número de Publicaciones
                600


                500



                400
Publicaciones




                300



                200



                100



                  0




                                 Institución
Nature. 2001 Feb 15;409(6822):860-921.
               Initial sequencing and analysis of the human genome.

Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W, Funke R, Gage
    D, Harris K, Heaford A, Howland J, Kann L, Lehoczky J, LeVine R, McEwan P, McKernan K, Meldrim J, Mesirov JP, Miranda
    C, Morris W, Naylor J, Raymond C, Rosetti M, Santos R, Sheridan A, Sougnez C, Stange-Thomann N,Stojanovic
    N, Subramanian A, Wyman D, Rogers J, Sulston J, Ainscough R, Beck S, Bentley D, Burton J, Clee C, Carter N, Coulson
    A, Deadman R, Deloukas P, Dunham A,Dunham I, Durbin R, French L, Grafham D, Gregory S, Hubbard T, Humphray
    S, Hunt A, Jones M, Lloyd C, McMurray A, Matthews L, Mercer S, Milne S, Mullikin JC, Mungall A,Plumb R, Ross
    M, Shownkeen R, Sims S, Waterston RH, Wilson RK, Hillier LW, McPherson JD, Marra MA, Mardis ER, Fulton
    LA, Chinwalla AT, Pepin KH, Gish WR, Chissoe SL, Wendl MC, Delehaunty KD, Miner TL, Delehaunty A, Kramer JB, Cook
    LL, Fulton RS, Johnson DL, Minx PJ, Clifton SW, Hawkins T, Branscomb E, Predki P, Richardson P,Wenning S, Slezak
    T, Doggett N, Cheng JF, Olsen A, Lucas S, Elkin C, Uberbacher E, Frazier M, Gibbs RA, Muzny DM, Scherer SE, Bouck
    JB, Sodergren EJ, Worley KC, Rives CM, Gorrell JH, Metzker ML, Naylor SL, Kucherlapati RS, Nelson DL, Weinstock
    GM, Sakaki Y, Fujiyama A, Hattori M, Yada T, Toyoda A, Itoh T, Kawagoe C, Watanabe H, Totoki Y,Taylor T, Weissenbach
    J, Heilig R, Saurin W, Artiguenave F, Brottier P, Bruls T, Pelletier E, Robert C, Wincker P, Smith DR, Doucette-Stamm
    L, Rubenfield M, Weinstock K, Lee HM, Dubois J, Rosenthal A, Platzer M, Nyakatura G, Taudien S, Rump A, Yang H, Yu
    J, Wang J, Huang G, Gu J, Hood L, Rowen L, Madan A, Qin S, Davis RW, Federspiel NA,Abola AP, Proctor MJ, Myers
    RM, Schmutz J, Dickson M, Grimwood J, Cox DR, Olson MV, Kaul R, Raymond C, Shimizu N, Kawasaki K, Minoshima
    S, Evans GA, Athanasiou M,Schultz R, Roe BA, Chen F, Pan H, Ramser J, Lehrach H, Reinhardt R, McCombie WR, de la
    Bastide M, Dedhia N, Blöcker H, Hornischer K, Nordsiek G, Agarwala R, Aravind L,Bailey JA, Bateman A, Batzoglou
    S, Birney E, Bork P, Brown DG, Burge CB, Cerutti L, Chen HC, Church D, Clamp M, Copley RR, Doerks T, Eddy SR, Eichler
    EE, Furey TS,Galagan J, Gilbert JG, Harmon C, Hayashizaki Y, Haussler D, Hermjakob H, Hokamp K, Jang W, Johnson
    LS, Jones TA, Kasif S, Kaspryzk A, Kennedy S, Kent WJ, Kitts P,Koonin EV, Korf I, Kulp D, Lancet D, Lowe TM, McLysaght
    A, Mikkelsen T, Moran JV, Mulder N, Pollara VJ, Ponting CP, Schuler G, Schultz J, Slater G, Smit AF, Stupka E,Szustakowski
    J, Thierry-Mieg D, Thierry-Mieg J, Wagner L, Wallis J, Wheeler R, Williams A, Wolf YI, Wolfe KH, Yang SP, Yeh RF, Collins
    F, Guyer MS, Peterson J, Felsenfeld A,Wetterstrand KA, Patrinos A, Morgan MJ, de Jong P, Catanese JJ, Osoegawa
    K, Shizuya H, Choi S, Chen YJ; International Human Genome Sequencing Consortium.

Whitehead Institute for Biomedical Research, Center for Genome Research, Cambridge, Massachusetts 02142, USA.
    lander@genome.wi.mit.edu
• The human genome holds an extraordinary trove of
  information about human development, physiology,
  medicine and evolution. Here we report the results of an
  international collaboration to produce and make freely
  available a draft sequence of the human genome. We also
  present an initial analysis of the data, describing some of
  the insights that can be gleaned from the sequence.
• Here we report the results of a collaboration involving 20
  groups from the United States, the United Kingdom, Japan,
  France, Germany and China to produce a draft sequence of
  the human genome.
• Of course, navigating information spanning nearly ten
  orders of magnitude requires computational tools to
  extract the full value.
FIGURA 1. Línea de tiempo de los análisis genómicos a gran escala.
        Nature 409, 860-921(15 February 2001)doi:10.1038/35057062
http://www.nature.com/nature/journal/v409/n6822/fig_tab/409860a0_F1.html
FIGURE 3. The automated production line for sample preparation at the Whitehead
Institute, Center for Genome Research.

Nature 409, 860-921(15 February 2001)doi:10.1038/35057062
http://www.nature.com/nature/journal/v409/n6822/images/409860ac.2.jpg
•   Science 16 February 2001:
    Vol. 291. no. 5507, pp. 1304 - 1351
    DOI: 10.1126/science.1058040
•   REVIEW
•   The Sequence of the Human Genome
•   J. Craig Venter,1* Mark D. Adams,1 Eugene W. Myers,1 Peter W. Li,1 Richard J. Mural,1 Granger G. Sutton,1 Hamilton O.
    Smith,1 Mark Yandell,1 Cheryl A. Evans,1Robert A. Holt,1 Jeannine D. Gocayne,1 Peter Amanatides,1 Richard M. Ballew,1 Daniel
    H. Huson,1 Jennifer Russo Wortman,1 Qing Zhang,1Chinnappa D. Kodira,1 Xiangqun H. Zheng,1 Lin Chen,1 Marian
    Skupski,1 Gangadharan Subramanian,1 Paul D. Thomas,1 Jinghui Zhang,1George L. Gabor Miklos,2 Catherine Nelson,3 Samuel
    Broder,1 Andrew G. Clark,4 Joe Nadeau,5 Victor A. McKusick,6 Norton Zinder,7 Arnold J. Levine,7Richard J. Roberts,8 Mel
    Simon,9 Carolyn Slayman,10 Michael Hunkapiller,11 Randall Bolanos,1 Arthur Delcher,1 Ian Dew,1 Daniel Fasulo,1 Michael
    Flanigan,1Liliana Florea,1 Aaron Halpern,1 Sridhar Hannenhalli,1 Saul Kravitz,1 Samuel Levy,1 Clark Mobarry,1 Knut
    Reinert,1 Karin Remington,1 Jane Abu-Threideh,1Ellen Beasley,1 Kendra Biddick,1 Vivien Bonazzi,1 Rhonda Brandon,1 Michele
    Cargill,1 Ishwar Chandramouliswaran,1 Rosane Charlab,1 Kabir Chaturvedi,1Zuoming Deng,1 Valentina Di Francesco,1 Patrick
    Dunn,1 Karen Eilbeck,1 Carlos Evangelista,1 Andrei E. Gabrielian,1 Weiniu Gan,1 Wangmao Ge,1Fangcheng Gong,1 Zhiping
    Gu,1 Ping Guan,1 Thomas J. Heiman,1 Maureen E. Higgins,1 Rui-Ru Ji,1 Zhaoxi Ke,1 Karen A. Ketchum,1 Zhongwu Lai,1 Yiding
    Lei,1Zhenya Li,1 Jiayin Li,1 Yong Liang,1 Xiaoying Lin,1 Fu Lu,1 Gennady V. Merkulov,1 Natalia Milshina,1 Helen M.
    Moore,1 Ashwinikumar K Naik,1Vaibhav A. Narayan,1 Beena Neelam,1 Deborah Nusskern,1 Douglas B. Rusch,1 Steven
    Salzberg,12 Wei Shao,1 Bixiong Shue,1 Jingtao Sun,1 Zhen Yuan Wang,1Aihui Wang,1 Xin Wang,1 Jian Wang,1 Ming-Hui
    Wei,1 Ron Wides,13 Chunlin Xiao,1 Chunhua Yan,1 Alison Yao,1 Jane Ye,1 Ming Zhan,1 Weiqing Zhang,1Hongyu Zhang,1 Qi
    Zhao,1 Liansheng Zheng,1 Fei Zhong,1 Wenyan Zhong,1 Shiaoping C. Zhu,1 Shaying Zhao,12 Dennis Gilbert,1 Suzanna
    Baumhueter,1Gene Spier,1 Christine Carter,1 Anibal Cravchik,1 Trevor Woodage,1 Feroze Ali,1 Huijin An,1 Aderonke Awe,1 Danita
    Baldwin,1 Holly Baden,1 Mary Barnstead,1Ian Barrow,1 Karen Beeson,1 Dana Busam,1 Amy Carver,1 Angela Center,1 Ming Lai
    Cheng,1 Liz Curry,1 Steve Danaher,1 Lionel Davenport,1 Raymond Desilets,1Susanne Dietz,1 Kristina Dodson,1 Lisa
    Doup,1 Steven Ferriera,1 Neha Garg,1 Andres Gluecksmann,1 Brit Hart,1 Jason Haynes,1 Charles Haynes,1 Cheryl
    Heiner,1Suzanne Hladun,1 Damon Hostin,1 Jarrett Houck,1 Timothy Howland,1 Chinyere Ibegwam,1 Jeffery Johnson,1 Francis
    Kalush,1 Lesley Kline,1 Shashi Koduru,1Amy Love,1 Felecia Mann,1 David May,1 Steven McCawley,1 Tina McIntosh,1 Ivy
    McMullen,1 Mee Moy,1 Linda Moy,1 Brian Murphy,1 Keith Nelson,1Cynthia Pfannkoch,1 Eric Pratts,1 Vinita Puri,1 Hina
    Qureshi,1 Matthew Reardon,1 Robert Rodriguez,1 Yu-Hui Rogers,1 Deanna Romblad,1 Bob Ruhfel,1Richard Scott,1 Cynthia
    Sitter,1 Michelle Smallwood,1 Erin Stewart,1 Renee Strong,1 Ellen Suh,1 Reginald Thomas,1 Ni Ni Tint,1 Sukyee Tse,1 Claire
    Vech,1Gary Wang,1 Jeremy Wetter,1 Sherita Williams,1 Monica Williams,1 Sandra Windsor,1 Emily Winn-Deen,1 Keriellen
    Wolfe,1 Jayshree Zaveri,1 Karena Zaveri,1Josep F. Abril,14 Roderic Guigó,14 Michael J. Campbell,1 Kimmen V. Sjolander,1 Brian
    Karlak,1 Anish Kejariwal,1 Huaiyu Mi,1 Betty Lazareva,1 Thomas Hatton,1Apurva Narechania,1 Karen Diemer,1 Anushya
    Muruganujan,1 Nan Guo,1 Shinji Sato,1 Vineet Bafna,1 Sorin Istrail,1 Ross Lippert,1 Russell Schwartz,1Brian Walenz,1 Shibu
    Yooseph,1 David Allen,1 Anand Basu,1 James Baxendale,1 Louis Blick,1 Marcelo Caminha,1 John Carnes-Stine,1 Parris
    Caulk,1Yen-Hui Chiang,1 My Coyne,1 Carl Dahlke,1 Anne Deslattes Mays,1 Maria Dombroski,1 Michael Donnelly,1 Dale
    Ely,1 Shiva Esparham,1 Carl Fosler,1 Harold Gire,1Stephen Glanowski,1 Kenneth Glasser,1 Anna Glodek,1 Mark Gorokhov,1 Ken
    Graham,1 Barry Gropman,1 Michael Harris,1 Jeremy Heil,1 Scott Henderson,1Jeffrey Hoover,1 Donald Jennings,1 Catherine
    Jordan,1 James Jordan,1 John Kasha,1 Leonid Kagan,1 Cheryl Kraft,1 Alexander Levitsky,1 Mark Lewis,1Xiangjun Liu,1 John
    Lopez,1 Daniel Ma,1 William Majoros,1 Joe McDaniel,1 Sean Murphy,1 Matthew Newman,1 Trung Nguyen,1 Ngoc Nguyen,1 Marc
    Nodell,1Sue Pan,1 Jim Peck,1 Marshall Peterson,1 William Rowe,1 Robert Sanders,1 John Scott,1 Michael Simpson,1 Thomas
    Smith,1 Arlan Sprague,1Timothy Stockwell,1 Russell Turner,1 Eli Venter,1 Mei Wang,1 Meiyuan Wen,1 David Wu,1 Mitchell
    Wu,1 Ashley Xia,1 Ali Zandieh,1 Xiaohong Zhu1
•   A 2.91-billion base pair (bp) consensus sequence of the euchromatic portion of the human genome was generated
    by the whole-genome shotgun sequencing method. The 14.8-billion bp DNA sequence was generated over
    9 months from 27,271,853 high-quality sequence reads (5.11-fold coverage of the genome) from both ends of
    plasmid clones made from the DNA of five individuals. Two assembly strategies--a whole-genome assembly and a
    regional chromosome assembly--were used, each combining sequence data from Celera and the publicly funded
    genome effort. The public data were shredded into 550-bp segments to create a 2.9-fold coverage of those
    genome regions that had been sequenced, without including biases inherent in the cloning and assembly
    procedure used by the publicly funded group. This brought the effective coverage in the assemblies toeightfold,
    reducing the number and size of gaps in the final assembly over what would be obtained with 5.11-fold coverage.
    The two assembly strategies yielded very similar results that largely agree with independent mapping data. The
    assemblies effectively cover the euchromatic regions of the human chromosomes. More than 90% of the genome
    is in scaffold assemblies of 100,000 bp or more, and 25% of the genome is in scaffolds of 10 million bp or
    larger. Analysis of the genome sequence revealed 26,588 protein-encoding transcripts for which there was strong
    corroborating evidence and an additional ~12,000 computationally derived genes with mouse matches or other
    weak supporting evidence. Although gene-dense clusters are obvious, almost half the genes are dispersed in
    low G+C sequence separated by large tracts of apparently noncoding sequence. Only 1.1% of the genome is
    spanned by exons, whereas 24% is in introns, with 75% of the genome being intergenic DNA. Duplications of
    segmental blocks, ranging in size up to chromosomal lengths, are abundant throughout the genome and reveal a
    complex evolutionary history. Comparative genomic analysis indicates vertebrate expansions of genes associated
    with neuronal function, with tissue-specific developmental regulation, and with the hemostasis and immune
    systems. DNA sequence comparisons between the consensus sequence and publicly funded genome data
    provided locations of 2.1 million single-nucleotide polymorphisms (SNPs). A random pair of human haploid
    genomes differed at a rate of 1 bp per 1250 on average, but there was marked heterogeneity in the level of
    polymorphism across the genome. Less than 1% of all SNPs resulted in variation in proteins, but the task of
    determining which SNPs have functional consequences remains an open challenge.
Fig. 2. Flow diagram
                                                      for sequencing
                                                      pipeline. Samples are
                                                      received, selected,
                                                      and processed in
                                                      compliance with
                                                      standard operating
                                                      procedures, with a
                                                      focus on quality within
                                                      and across
                                                      departments. Each
                                                      process has defined
                                                      inputs and outputs
                                                      with the capability to
                                                      exchange samples and
                                                      data with both
                                                      internal and external
                                                      entities according to
                                                      defined quality
                                                      guidelines.
                                                      Manufacturing
                                                      pipeline processes,
                                                      products, quality
                                                      control measures, and
                                                      responsible parties are
                                                      indicated and are
                                                      described further in
                                                      the text.



J. C. Venter et al., Science 291, 1304 -1351 (2001)
http://genome.ucsc.edu/cgi-bin/hgTracks?org=human
Registro de PubMed




http://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html
OMICS
•   Los estudios “omics” están involucrados en el análisis de cantidades grandes de parámetros,
    generalmente proteínas (proteomics), lípidos (lipidomics) y metabolitos (metabolomics). El término
    “omics” deriva del sufijo griego “ome” que significa muchos o masa. Las mediciones se hacen a
    base de marcadores químicos que son indicativos de algún evento biológico (biomarkers). Los
    valores asociados con los parámetros medidos son investigados con el fin de encontrar una
    correlación con enfermedades. Cuando los objetos de investigación son proteinas, genes y
    metabolitos, las aproximaciones correspondientes son proteomics, genomics y metabolommics.
•   En años recientes, con el desarrollado de métodos para medir y analizar un número muy grande
    de analitos de una sola muestra, se ha popularizado las investigaciones que intentan medir miles
    de parámetros en vez de sólo unos cuantos. Esta aproximación es la que dio pie a los
    experimentos modernos de “omics.”
•   La meta final de las aproximaciones “omics” es comprender comprehensiva e integralmente los
    procesos biológicos, mediante la identificación y correlación de varios “jugadores” (e.g. genes,
    RNA, proteínas, metabolitos) en vez de estudiar cada uno de ellos de manera individual.
•   Lamentablemente, un estudio sobre la probabilidad de reproducir investigaciones en "genomics"
    (asociar grupos de genes con enfermedades complejas), en el cual se compararon 370 estudios,
    reveló una alta frecuencia de investigaciones subsecuentes que no confirmaban los
    descubrimientos iniciales. Debido al enorme número de mediciones y el número limitado de
    muestras de investigación, surgen problemas relacionados a la estadística, el sesgo, la
    metodología y el uso inadecuado del método.
•

•   Layjr, J., Liyanage, R., Borgmann, S., & Wilkins, C. (2006). Problems with the “omics”. TrAC Trends
    in Analytical Chemistry, 25(11), 1046-1056. doi: 10.1016/j.trac.2006.10.007.
OMIC’S             ARTICULO
Genomics           'Genomics': buzzword or reality?
                   http://view.ncbi.nlm.nih.gov/pubmed/10343163
Metabolomics       Metabolomic
                   http://www.benthamdirect.org/pages/content.php?CDM/2008/00000009/00000001/0011F.SGM
Proteomics         Proteomics
                   http://dx.doi.org/10.1097/01.mnh.0000079691.89474.ee
Transcriptomics    Transcriptomics
                   http://view.ncbi.nlm.nih.gov/pubmed/18336229
Vaccinomics        Vaccinomics
                   http://www.gtmb.org/VOL12B/PDF/16._Gomase_&_Tagore,_141-146.pdf
Oncogenomics       Oncogenomics
                   http://www.ncbi.nlm.nih.gov/pubmed/18336222
Pharmacogenomics   Pharmacogenomics
                   http://www.ncbi.nlm.nih.gov/pubmed/18336223
Epigenomics        Epigenomics.
                   http://www.ncbi.nlm.nih.gov/pubmed/18336226
Toxicogenomics     Toxicogenomics.
                   http://www.ncbi.nlm.nih.gov/pubmed/18336230
Kinomics           Kinomics
                   http://www.ncbi.nlm.nih.gov/pubmed/18336231
Physiomics         Physiomics
                   http://www.ncbi.nlm.nih.gov/pubmed/18336232
Cytomics           Cytomics
                   http://www.ncbi.nlm.nih.gov/pubmed/18336233
Postgenomics       Tracking the shift to 'postgenomics'
                    http://dx.doi.org/10.1159/000092656
Glycomics          Probing glycomics
                   http://dx.doi.org/10.1016/j.cbpa.2006.11.040
Lipidomics         Lipidomics is emerging.
                   http://view.ncbi.nlm.nih.gov/pubmed/14643793
Cellunomic         Cellunomics: the interaction analysis of cells
                    http://view.ncbi.nlm.nih.gov/pubmed/19887340
Phylogenomics      Phylogenomics: evolution and genomics intersection
                   http://view.ncbi.nlm.nih.gov/pubmed/19778869
http://biiiogeek.blogspot.com/
http://laylamichanunam.blogspot.com/
• Este proyecto se lleva a cabo gracias al
  financiamiento de:

  DGAPA, UNAM
  Proyecto PAPIME PE 201509
Agradecimientos
•   Laura Montoya
•   Lourdes Valencia
•   Fernando Galicia
•   Roberto Calderón
•   Lyssania Macías
No se nos ha escapado a nuestra atención que
  cuánto más exploramos el genoma humano,
más nos queda por explorar. "No cesaremos de
   explorar. Pues al final de toda exploración
llegaremos donde empezamos, y conoceremos
     cuál es nuestro lugar por primera vez“

         Thomas Stearns, Eliot, 2001

Mais conteúdo relacionado

Mais procurados (11)

Bueno
BuenoBueno
Bueno
 
Científicos colombianos ii
Científicos colombianos iiCientíficos colombianos ii
Científicos colombianos ii
 
tecnologia de puntas
tecnologia de puntastecnologia de puntas
tecnologia de puntas
 
Biol mol medicina_2008
Biol mol medicina_2008Biol mol medicina_2008
Biol mol medicina_2008
 
Biologia molecular en la medicina
Biologia molecular en la medicina Biologia molecular en la medicina
Biologia molecular en la medicina
 
Informe final
Informe finalInforme final
Informe final
 
Cientificos colombianos
Cientificos colombianosCientificos colombianos
Cientificos colombianos
 
Tema 1 : GENÈTICA
Tema 1 : GENÈTICATema 1 : GENÈTICA
Tema 1 : GENÈTICA
 
Biología sintética
Biología sintéticaBiología sintética
Biología sintética
 
Jorge orlando melo
Jorge orlando meloJorge orlando melo
Jorge orlando melo
 
Robotica nanitecnolo
Robotica nanitecnoloRobotica nanitecnolo
Robotica nanitecnolo
 

Semelhante a Genomica colombia

01 bienvenidos al_curso_de_microbiolog_a_fcb0
01 bienvenidos al_curso_de_microbiolog_a_fcb001 bienvenidos al_curso_de_microbiolog_a_fcb0
01 bienvenidos al_curso_de_microbiolog_a_fcb0Luis Huayhua
 
unidad-i-introduccion-a-la-biologia-130509005020-phpapp01.pdf
unidad-i-introduccion-a-la-biologia-130509005020-phpapp01.pdfunidad-i-introduccion-a-la-biologia-130509005020-phpapp01.pdf
unidad-i-introduccion-a-la-biologia-130509005020-phpapp01.pdfRobertoCastellanos34
 
Sinopsis cronológica de la biotecnologia ambiental
Sinopsis cronológica de la biotecnologia ambiental Sinopsis cronológica de la biotecnologia ambiental
Sinopsis cronológica de la biotecnologia ambiental GustavoSanti3
 
Sinopsis cronológica de la biotecnología ambiental
Sinopsis cronológica de la biotecnología ambientalSinopsis cronológica de la biotecnología ambiental
Sinopsis cronológica de la biotecnología ambientalBrayan Chipana
 
Curso de botanica general
Curso de botanica generalCurso de botanica general
Curso de botanica generalmarcos murillo
 
SESION 01 MICROBIOLOGIA ENFERMERIA.pptx
SESION 01 MICROBIOLOGIA ENFERMERIA.pptxSESION 01 MICROBIOLOGIA ENFERMERIA.pptx
SESION 01 MICROBIOLOGIA ENFERMERIA.pptxronycotaquispe
 
El arte desde la Biología
El arte desde la BiologíaEl arte desde la Biología
El arte desde la BiologíaFreire Juan
 
1 clase 1 historia sisteamtica Unidad 1. ener-abril 2024.pdf
1 clase 1 historia sisteamtica Unidad 1. ener-abril 2024.pdf1 clase 1 historia sisteamtica Unidad 1. ener-abril 2024.pdf
1 clase 1 historia sisteamtica Unidad 1. ener-abril 2024.pdfOsvaldoDeJesusRosari
 
Tema 1- Conceptos de Antropología Física.pdf
Tema 1- Conceptos de Antropología Física.pdfTema 1- Conceptos de Antropología Física.pdf
Tema 1- Conceptos de Antropología Física.pdfluismartinez168423
 
Ciencia de la informacion y bibliotecologia
Ciencia de la informacion y bibliotecologiaCiencia de la informacion y bibliotecologia
Ciencia de la informacion y bibliotecologiaSocorro324
 

Semelhante a Genomica colombia (20)

Bioingenieria
BioingenieriaBioingenieria
Bioingenieria
 
01 bienvenidos al_curso_de_microbiolog_a_fcb0
01 bienvenidos al_curso_de_microbiolog_a_fcb001 bienvenidos al_curso_de_microbiolog_a_fcb0
01 bienvenidos al_curso_de_microbiolog_a_fcb0
 
introducción a la biologia
introducción a la biologiaintroducción a la biologia
introducción a la biologia
 
unidad-i-introduccion-a-la-biologia-130509005020-phpapp01.pdf
unidad-i-introduccion-a-la-biologia-130509005020-phpapp01.pdfunidad-i-introduccion-a-la-biologia-130509005020-phpapp01.pdf
unidad-i-introduccion-a-la-biologia-130509005020-phpapp01.pdf
 
Nadia dhtics 2
Nadia dhtics 2Nadia dhtics 2
Nadia dhtics 2
 
Sinopsis cronológica de la biotecnologia ambiental
Sinopsis cronológica de la biotecnologia ambiental Sinopsis cronológica de la biotecnologia ambiental
Sinopsis cronológica de la biotecnologia ambiental
 
Sinopsis cronológica de la biotecnología ambiental
Sinopsis cronológica de la biotecnología ambientalSinopsis cronológica de la biotecnología ambiental
Sinopsis cronológica de la biotecnología ambiental
 
Curso de botanica general
Curso de botanica generalCurso de botanica general
Curso de botanica general
 
1.historia micro
1.historia micro1.historia micro
1.historia micro
 
Antropologia y marxismo
Antropologia y marxismoAntropologia y marxismo
Antropologia y marxismo
 
SESION 01 MICROBIOLOGIA ENFERMERIA.pptx
SESION 01 MICROBIOLOGIA ENFERMERIA.pptxSESION 01 MICROBIOLOGIA ENFERMERIA.pptx
SESION 01 MICROBIOLOGIA ENFERMERIA.pptx
 
El arte desde la Biología
El arte desde la BiologíaEl arte desde la Biología
El arte desde la Biología
 
1 clase 1 historia sisteamtica Unidad 1. ener-abril 2024.pdf
1 clase 1 historia sisteamtica Unidad 1. ener-abril 2024.pdf1 clase 1 historia sisteamtica Unidad 1. ener-abril 2024.pdf
1 clase 1 historia sisteamtica Unidad 1. ener-abril 2024.pdf
 
Tema 1- Conceptos de Antropología Física.pdf
Tema 1- Conceptos de Antropología Física.pdfTema 1- Conceptos de Antropología Física.pdf
Tema 1- Conceptos de Antropología Física.pdf
 
280
280280
280
 
Trabajo de cmc421
Trabajo de cmc421Trabajo de cmc421
Trabajo de cmc421
 
Bachillerato lomce
Bachillerato lomceBachillerato lomce
Bachillerato lomce
 
Ciencia de la informacion y bibliotecologia
Ciencia de la informacion y bibliotecologiaCiencia de la informacion y bibliotecologia
Ciencia de la informacion y bibliotecologia
 
Microbiologia
MicrobiologiaMicrobiologia
Microbiologia
 
plagas agrosabia.pdf
plagas agrosabia.pdfplagas agrosabia.pdf
plagas agrosabia.pdf
 

Mais de E-investigación bibliográfica, FCUNAM

3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica
3m 8ago11E-investigación  bibliográfica:  Web 2.0 y 3.0, teoría y  práctica3m 8ago11E-investigación  bibliográfica:  Web 2.0 y 3.0, teoría y  práctica
3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y prácticaE-investigación bibliográfica, FCUNAM
 

Mais de E-investigación bibliográfica, FCUNAM (20)

¿Realmente sabes buscar en Google?
¿Realmente sabes buscar en Google?¿Realmente sabes buscar en Google?
¿Realmente sabes buscar en Google?
 
Literatura sobre la herpetofauna de méxico layla
Literatura sobre la herpetofauna de méxico laylaLiteratura sobre la herpetofauna de méxico layla
Literatura sobre la herpetofauna de méxico layla
 
Acceso Abierto y Literatura Biológica Gerardo Ávila Torres
Acceso Abierto y Literatura Biológica Gerardo Ávila TorresAcceso Abierto y Literatura Biológica Gerardo Ávila Torres
Acceso Abierto y Literatura Biológica Gerardo Ávila Torres
 
Mandato completo final
Mandato completo finalMandato completo final
Mandato completo final
 
Análisis moda
Análisis moda Análisis moda
Análisis moda
 
Latindex, Clase, Periódica y SciELO
Latindex, Clase, Periódica y SciELOLatindex, Clase, Periódica y SciELO
Latindex, Clase, Periódica y SciELO
 
Scielo 2011
Scielo 2011Scielo 2011
Scielo 2011
 
Latindex 2011
Latindex 2011Latindex 2011
Latindex 2011
 
Clase y Periódica UNAM, 2011
Clase y Periódica UNAM, 2011Clase y Periódica UNAM, 2011
Clase y Periódica UNAM, 2011
 
3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica
3m 8ago11E-investigación  bibliográfica:  Web 2.0 y 3.0, teoría y  práctica3m 8ago11E-investigación  bibliográfica:  Web 2.0 y 3.0, teoría y  práctica
3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica
 
Repositorio Ciencias, UNAM
Repositorio Ciencias, UNAMRepositorio Ciencias, UNAM
Repositorio Ciencias, UNAM
 
Información e informática para biodiversidad
Información e informática para biodiversidadInformación e informática para biodiversidad
Información e informática para biodiversidad
 
E tax colombia final
E tax colombia finalE tax colombia final
E tax colombia final
 
Web y ciencia
Web y cienciaWeb y ciencia
Web y ciencia
 
Ensayo gloriasarraga
Ensayo gloriasarragaEnsayo gloriasarraga
Ensayo gloriasarraga
 
Trabajo final 2010-2_aida
Trabajo final 2010-2_aidaTrabajo final 2010-2_aida
Trabajo final 2010-2_aida
 
Trabajo final 2010-2_karla
Trabajo final 2010-2_karlaTrabajo final 2010-2_karla
Trabajo final 2010-2_karla
 
Ensayo gloriasarraga
Ensayo gloriasarragaEnsayo gloriasarraga
Ensayo gloriasarraga
 
Acceso abierto CUIB
Acceso abierto CUIBAcceso abierto CUIB
Acceso abierto CUIB
 
Información, informática y cienciometría para envejecimiento
Información, informática y cienciometría  para envejecimientoInformación, informática y cienciometría  para envejecimiento
Información, informática y cienciometría para envejecimiento
 

Genomica colombia

  • 1. Cátedra de genética Universidad Nacional Autónoma de Colombia Sede Bogotá (r)evolución de información en biología: el caso de la genómica Layla Michán Departamento de Biología Evolutiva, Facultad de Ciencias, UNAM
  • 2. PROBLEMAS 1. (R)evolución digital en las ciencias biológicas 2. Características de la E-biología 3. Dinámica, estructura y relaciones de la biología reciente 4. Publicación científica 5. Recursos web y ciberinfraestructura para biología 6. Colecciones de datos 7. Meta-análisis de literatura: bibliometría, análisis de redes, minería de textos, semántica TIPOS 1.Biológica ENFOQUES 1.Biología 2.Bibliográfica 2.Ciencias de la información y 3.Institucional INFORMACIÓN documentación 3.Tecnologías de la ÁREAS BIOLÓGICA Información y comunicación 1.Biodiversidad 4.Ciencias de la computación 2.Biomedicina APLICACIONES 1.Obtención de nuevo conocimiento (Biología) 2.Análisis de la ciencia actual (Bibliometría, Historia, Sociología) 3.Ciencias de la Información y la documentación biológica 4.Planeación, evaluación, gestión y política científica
  • 3. Historia de la ciencias Etapas • Antigüedad (III ac V d.c.) • Edad Media.(V-XIV) • Renacimiento (XV-XVI) • Etapa Moderna Temprana (XVII-XVIII) • Etapa Moderna (1800-1950) • Etapa Reciente o Contemporánea(1950-2010)
  • 4. Historia Biología (Problemas) Historia Natural (in vivo) – Siglo III A.C-XIX Biología Siglo XX (in vitro) Molecularización Siglo XXI (in silico) Computarización
  • 5. Los problemas de la Herencia Siglo XIX • La biología es una rama del conocimiento derivada de la síntesis de diversas tradiciones científicas, sin duda la más importante es la Historia Natural pero durante el siglo XIX hubo otras quizás menos abundantes en cuanto a producción, pero igualmente relevantes en cuanto a las innovaciones conceptuales para la biología actual, entre estas están: • La herencia que estudiaba como se transmiten los caracteres de los padres a los hijos con base en: – La de los criadores y mejoradores enfocados al estudio del mejoramiento (especialmente de plantas), es decir en la herencia de los caracteres importantes para el hombre (agronomía actual). – La de los hibridólogos encargados de estudiar la herencia de caracteres y la naturaleza de la especie (esencialista y nominalista) iniciada con Linneo. • Había dos formas de estudiar la herencia de caracteres: – Los arboles genealógicos o pedigrís. – Cruzas entre individuos con distintos caracteres
  • 6. Gregor Mendel (1822-1884) • En 1900 se redescubrió el trabajo de Gregor Mendel, quien en 1865 había anunciado el resultado de sus estudios con chícharos ante la Sociedad Bruniana. • Los principales postulados de sus experimentos fueron: – Ciertos caracteres que pueden distinguirse fácilmente muestran predominancia de unos sobre otros en la progenie de la cruza de padres con caracteres opuestos o diferenciados. – Dos caracteres son transmitidos como elementos diferentes, uno del padre y otro de la madre, en donde uno es dominante y el otro recesivo . Los caracteres que se transmiten y aparecen en la primera generación son los dominantes y los que permanecen ocultos o de forma latente en el proceso son los recesivos. • Mendel usó la expresión recesivo porque estos caracteres desaparecen en la primera generación, pero reaparecen en las subsecuentes. • Reconoció que esos pares actúan independientemente de otros pares de caracteres. • De estos dos principios derivó algunas reglas aritméticas que rigen la herencia
  • 7. Para progenies de híbridos con un par de caracteres diferenciantes) R y r, su proporción de la progenie será de tres dominantes contra un recesivo. Cuando difieren en dos pares de caracteres la proporción será de 9:3:3:1.
  • 8. Redescubrimiento de las leyes de Mendel En 1900 de manera independiente publicaron los resultados de sus trabajos haciendo referencia al trabajo “precursor” de Mendel: • El botánico holandés Hugo de Vries (1848-1935) • El botánico alemán Carl Correns (1864-1933) • El austríaco Eric Tschermak von Seysenegg (1871-1962) Este hecho marcó el inicio del estudio de la genética se extendieron y aplicaron los conocimientos mendelianos. • Sólo Correns comprendió completamente el trabajo de Mendel y sus consecuencias. Tanto De Vries como Tschermak no entendían conceptos como dominancia y confundían en una las dos leyes de Mendel en una sola. Es entonces muy claro que el trabajo de Mendel no fue entendido ni en sus aspectos técnicos ni tampoco en su importancia. De hecho, el entendimiento de su relevancia vino antes de ser entendido técnicamente.
  • 9. Tomas H. Morgan (1866-1945) Teoría cromosómica de la herencia Mapas cromosómicos Herencia ligada al sexo Nobel 1933
  • 10. El término biología molecular fue acuñado por el Director de la División de Ciencias Naturales de la fundación Rokefeller, Warren Weaver, en 1938. Warren Weaver Warren Weaver Hall (1894-1978) Washington
  • 11. Hechos históricos http://www.nature.com/nature/journal/v422/n6934/pdf/tim eline_01626.pdf
  • 12. James Watson y Francis Crick Premio Nobel 1962
  • 13. 1990: TICS Y BIOLOGÍA
  • 14. La sociedad del conocimiento • Se refiere al incremento espectacular y a la aceleración sin precedente del ritmo de creación, acumulación, distribución y aprovechamiento de la información y el conocimiento. -El conocimiento se crea, se acumula, se difunde y se aprovecha, pues orienta las decisiones y permite la intervención en el mundo, de acuerdo con ciertos fines y valores (Morales, 2001). • El modelo de la Sociedad del Conocimiento está en construcción al igual que la sociedad misma (Olivé, 2005).
  • 15. (Re)evolución de la información (1990) • Diseño de las computadoras. • Aparición del Internet • Masificación de la web. • Formato digital: bajo costo, poco espacio. • Explosión de la información. • Gran cantidad de colecciones de datos . • Dinámica: cambia, está en modificación constante, tanto el contenido como los formatos. • Masiva • Aplicaciones de mata-análisis
  • 16. (Re)evolución de la información (científica) • La adopción del formato electrónico. • Producción acelerada de una gran variedad de programas, aplicaciones, herramientas, utilidades recursos y servicios electrónicos para la práctica científica, muchos de ellos disponibles a través de la Internet. • Uso de la Web como medio de comunicación. • El número de los investigadores y de sus publicaciones se duplica aproximadamente cada veinte años. • Viven actualmente entre un 80% y un 90% de los científicos que han existido. • Se publican cada año mas de dos millones de artículos. • Se conceden un millón de patentes. • Modificación en la forma de producir, evaluar y consultar la información. – Revistas electrónicas – Procedimiento electrónico – Evaluación libre – E-prints: Preprints y posprints – Inmediatez • Se han producido nuevas disciplinas científicas
  • 17. La transformación de la biología • Molecularización • Colaboración • Multidisciplinariedad • Proyectos internacionales • Grids • Nuevos modelos • Nuevas disciplinas – Bioinformática – Informática Médica – Neuroinformática – Biología de Sistemas • Colecciones de datos – Biológicas – Bibliográficas
  • 18. Investigación biológica Descripción Comparación Observación Experimentación Clasificación In vivo In vitro (1900) Investigación Científica In Silico (1990) (Biología)
  • 19. 3000 Escherichia (94873) Drosophila (48989) 2500 Saccharomyces (27549) Arabidopsis (18094) Caenorhabditis (5353) 2000 Documents 1500 1000 500 0 1900 1905 1910 1915 1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 Year
  • 20. 250 Zea (7636) Neurospora (6640) Dictyostelium (6191) 200 Chlamydomonas (5646) Schizosaccharomyces (3183) Danio (973) 150 Documentos 100 50 0 1900 1905 1910 1915 1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 Year
  • 21. 706 Behavioral Scien 782 Biotech & Microbio 1200 Biophysics 1231 Physiology 1258 Toxicology 1465 Entomology 1811 (2) 1258 Ecology 2340 (3) Evolutionary Bio Figure 21 2365 Zoology Subject Area 2482 (2) Biology 2519 (1) Neurosciences 4310 (20) Multidisciplinary 6328 (3) Develop Bio 8137 (15) Cell Bio 10907 (18) Biochem & Mol Bio 17900 (6) Genetics & Heredity 0% 5% 30% 25% 20% 15% 40% 35% 10% Documents
  • 22. 600 Genetics & Heredity Biochemistry & Molecular Biology 500 Cell Biology Developmental Biology 400 Neuroscience Documents 300 200 100 0 1905 1910 1915 1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 Year Figure 22
  • 23. 2005 2000 1995 1990 1985 1980 1975 1970 1965 1960 Figure 23 Year 1955 1950 1945 Evolutionary Biology 1940 1935 Toxicology 1930 Zoology Ecology 1925 1920 1915 1910 1905 100 80 70 50 40 30 20 0 90 60 10 Documents
  • 24. Colección de secuencias de E-ciencia genes Ciberinfraestructura
  • 25. Genbank • Es una colección anotada de todas las secuencias de nucleótidos a disposición del público y su traducción de proteínas. • Centro Nacional de Información Biotecnológica (NCBI) • European Molecular Biology Laboratory (EMBL) de datos de Bibliotecas del Instituto Europeo de Bioinformática (EBI) • DNA Data Bank de Japón (DDBJ). • Reciben las secuencias producidas en laboratorios de todo el mundo de más de 100.000 organismos distintos. • Crece a un ritmo exponencial, duplicando cada 10 meses. Suelte 134, producido en febrero de 2003, contenía más de 29300 millones de bases nucleotídicas en más de 23,0 millones de secuencias. • Se construye mediante el envío directo de los distintos laboratorios y de los centros de secuenciación a gran escala.
  • 27. Olson M, Hood L, Cantor C, Botstein D. A common language for physical mapping of the human genome. Science. 1989; 245 (4925): 1434– 1435. [PubMed]
  • 28. 800.000 Documentos en PubMed (NIH) 700.000 600.000 500.000 400.000 300.000 200.000 100.000 0 1870 1885 1900 1915 1930 1945 1960 1975 1985 1990 2000 2005 1865 1875 1880 1890 1895 1905 1910 1920 1925 1935 1940 1950 1955 1965 1970 1980 1995 Cerca de 20 millones octubre, 2010)
  • 29. e-science/ cyberinfraestructure • cyberinfraestructure (USA) • e-science (europe) • United States National Science • United Kingdom's Office of Foundation (NSF) blue-ribbon Science and Technology in committee in 2003 1999 • Describes the new research • Will refer to the large scale environments that support advanced data acquisition, data science that will storage, data management, data increasingly be carried out integration, data mining, data through distributed global visualization and other computing collaborations enabled by and information processing the Internet services over the Internet
  • 30. Ciberinfraestructura •Entorno tecnológico-social que permite crear, difundir y preservar los datos, información y conocimientos mediante la adquisición, almacenamiento, gestión, integración, informática, minería, visualización y otros servicios a través de Internet (NSF 2003, 2007). •Incluye un conjunto interoperable de diversos elementos: –1) Infraestructura, los sistemas computacionales (hardware, software y redes), servicios, instrumentos y herramientas. –2) Colecciones de datos. –3) Grupos virtuales de investigación (colaboratorios y observatorios).
  • 31. e-investigación • Actividades de investigación que utilizan una gama de capacidades avanzadas de las TIC y abarca nuevas metodologías de investigación que salen de un mayor acceso a: * Las comunicaciones de banda ancha de redes, instrumentos de investigación y las instalaciones, redes de sensores y repositorios de datos; * Software y servicios de infraestructura que permitan garantizar la conectividad e interoperabilidad; * Aplicación herramientas que abarcan la disciplina de instrumentos específicos y herramientas de interacción. avanzar y aumentar, en lugar de reemplazar las tradicionales metodologías de investigación, • permitirá a los investigadores para llevar a cabo su labor de investigación más creativa, eficiente y colaboración a larga distancia y difundir sus resultados de la investigación con un mayor efecto. • Colaboración Nuevos campos de investigación emergentes, utilizando nuevas técnicas de minería de datos y el análisis, avanzados algoritmos computacionales y de redes de intercambio de recursos.
  • 32. e-Science • Originally referred to experiments that connected together a few powerful computers located at different sites and, later, a very large number of modest PCs across the world in order to undertake enormous calculations or process huge amounts of data. The coordination of geographically dispersed computing and data resources has become known as the Grid. This is shorthand for the emerging standards and technology – hardware and software – being developed to enable and simplify the sharing of resources. The analogy is an electric power grid, which comprises numerous varied resources connected together to contribute power into a shared pool that users can easily access when they need it. • What is exciting about the Grid is that the combination of extensive connectivity, massive computer power and vast quantities of digitized data – all three of which are still rapidly expanding – making possible new applications that are orders of magnitude more potent than even a few years ago. • The term 'e-research' is sometimes used instead of 'e-science', with the advantage that gives more emphasis to the end result of better, richer, faster or new research results, rather than the technologies used to get them. National Centre for e-Social Science. 2008. Frequently Asked Questions. Diponible en: http://www.ncess.ac.uk/about_eSS/faq/?q=General_1#General_1
  • 33. E-ciencia (e-science) • Resulta del uso y aplicación de la Ciberinfraestructura en la práctica cientifica, • Se caracteriza por la inter y multidisciplinariedad. • Colaboración, la participación de un gran número de investigadores (en algunos casos cientos) localizados en diversas regiones y con diferentes especialidades que se forman grupos trabajo (Hey y Trefethen, 2005; Barbera et al.,2009).
  • 34. E-ciencia Uno de los primeros proyectos de e-ciencia fue el de el genoma humano, se publicó en el 2001 en dos artículos con un día de diferencia en las revistas Nature y Science. Nature:Initial sequencing and analysis of the human genome 79 Autores 48 Instituciones 181 referencias Todos los autores provenientes de departamentos de Ciencias Genómicas (o genética) exceptuando los siguientes: Department of Cellular and Structural Biology Department of Molecular Genetics Department of Molecular Biology Science: The Sequence of the Human Genome 276 Autores 14 Instituciones 452 referencias Todos los autores provenientes de departamentos de Ciencias Genómicas (o genética) exceptuando los siguientes: Department of Biology e Informática Médica
  • 35.
  • 36. 1865 Gregor Mendel descubre las leyes de la Genética http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf 1953 James Watson y Francis Crick describen la estructura de la doble-hélice del ADN http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf 1966 Marshall Nirenberg, Har Gobind Khorana y Robert Holley determinan el código http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf genético 1972 Stanley Cohen and Herbert Boyer desarrollan la tecnología del ADN recombinante http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf 1977 Frederick Sanger, Allan Maxam y Walter Gilbert desarrollan métodos de http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf secuenciación del ADN 1982 La base de datos „GenBank‟ es establecida http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf 1985 Es inventada la Reacción en Cadena de la Polimerasa (PCR) http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf 1990 El Proyecto Genoma Humano (HGP) inicia en Estados Unidos http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf 1997 El genoma de Escherichia coli es secuenciado http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf 2003 La secuencia del genoma humano es finalizada http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf
  • 37. La Genómica • Es el estudio sistemático de la documentación completa de las secuencias del ADN de los organismos (MeSH, 2010), dicho estudio ha ayudado a comprender polimorfismos dentro de las especies, la interacción de las proteínas y la evolución (Brent, 2000). • Incluye todos los métodos que recopilan y analizan datos completos acerca de los genes, incluida las secuencias, la abundancia de los ácidos nucleicos y las propiedades de las proteínas que codifican (Murray, 2000). • Nuestra capacidad para estudiar la función génica está aumentando en la especificidad gracias a esta nueva disciplina (Collins, et ál., 2003) que se compromete a acelerar el descubrimiento científico en todos los ámbitos de la ciencia biológica (Burley, 2000).
  • 38. Número de Publicaciones 3500 Pathology and immunopathology 3000 research en 1988; The genomics of human homeobox-containing 2500 loci‟, escrito por CA Ferguson-Smith y FH Ruddle del Departamento de Publicaciones 2000 Biología, en la Universidad de Yale, 1500 New Haven, Connecticut. 1000 500 0 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Año
  • 39. Número de Publicaciones 600 500 400 Publicaciones 300 200 100 0 Institución
  • 40. Nature. 2001 Feb 15;409(6822):860-921. Initial sequencing and analysis of the human genome. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W, Funke R, Gage D, Harris K, Heaford A, Howland J, Kann L, Lehoczky J, LeVine R, McEwan P, McKernan K, Meldrim J, Mesirov JP, Miranda C, Morris W, Naylor J, Raymond C, Rosetti M, Santos R, Sheridan A, Sougnez C, Stange-Thomann N,Stojanovic N, Subramanian A, Wyman D, Rogers J, Sulston J, Ainscough R, Beck S, Bentley D, Burton J, Clee C, Carter N, Coulson A, Deadman R, Deloukas P, Dunham A,Dunham I, Durbin R, French L, Grafham D, Gregory S, Hubbard T, Humphray S, Hunt A, Jones M, Lloyd C, McMurray A, Matthews L, Mercer S, Milne S, Mullikin JC, Mungall A,Plumb R, Ross M, Shownkeen R, Sims S, Waterston RH, Wilson RK, Hillier LW, McPherson JD, Marra MA, Mardis ER, Fulton LA, Chinwalla AT, Pepin KH, Gish WR, Chissoe SL, Wendl MC, Delehaunty KD, Miner TL, Delehaunty A, Kramer JB, Cook LL, Fulton RS, Johnson DL, Minx PJ, Clifton SW, Hawkins T, Branscomb E, Predki P, Richardson P,Wenning S, Slezak T, Doggett N, Cheng JF, Olsen A, Lucas S, Elkin C, Uberbacher E, Frazier M, Gibbs RA, Muzny DM, Scherer SE, Bouck JB, Sodergren EJ, Worley KC, Rives CM, Gorrell JH, Metzker ML, Naylor SL, Kucherlapati RS, Nelson DL, Weinstock GM, Sakaki Y, Fujiyama A, Hattori M, Yada T, Toyoda A, Itoh T, Kawagoe C, Watanabe H, Totoki Y,Taylor T, Weissenbach J, Heilig R, Saurin W, Artiguenave F, Brottier P, Bruls T, Pelletier E, Robert C, Wincker P, Smith DR, Doucette-Stamm L, Rubenfield M, Weinstock K, Lee HM, Dubois J, Rosenthal A, Platzer M, Nyakatura G, Taudien S, Rump A, Yang H, Yu J, Wang J, Huang G, Gu J, Hood L, Rowen L, Madan A, Qin S, Davis RW, Federspiel NA,Abola AP, Proctor MJ, Myers RM, Schmutz J, Dickson M, Grimwood J, Cox DR, Olson MV, Kaul R, Raymond C, Shimizu N, Kawasaki K, Minoshima S, Evans GA, Athanasiou M,Schultz R, Roe BA, Chen F, Pan H, Ramser J, Lehrach H, Reinhardt R, McCombie WR, de la Bastide M, Dedhia N, Blöcker H, Hornischer K, Nordsiek G, Agarwala R, Aravind L,Bailey JA, Bateman A, Batzoglou S, Birney E, Bork P, Brown DG, Burge CB, Cerutti L, Chen HC, Church D, Clamp M, Copley RR, Doerks T, Eddy SR, Eichler EE, Furey TS,Galagan J, Gilbert JG, Harmon C, Hayashizaki Y, Haussler D, Hermjakob H, Hokamp K, Jang W, Johnson LS, Jones TA, Kasif S, Kaspryzk A, Kennedy S, Kent WJ, Kitts P,Koonin EV, Korf I, Kulp D, Lancet D, Lowe TM, McLysaght A, Mikkelsen T, Moran JV, Mulder N, Pollara VJ, Ponting CP, Schuler G, Schultz J, Slater G, Smit AF, Stupka E,Szustakowski J, Thierry-Mieg D, Thierry-Mieg J, Wagner L, Wallis J, Wheeler R, Williams A, Wolf YI, Wolfe KH, Yang SP, Yeh RF, Collins F, Guyer MS, Peterson J, Felsenfeld A,Wetterstrand KA, Patrinos A, Morgan MJ, de Jong P, Catanese JJ, Osoegawa K, Shizuya H, Choi S, Chen YJ; International Human Genome Sequencing Consortium. Whitehead Institute for Biomedical Research, Center for Genome Research, Cambridge, Massachusetts 02142, USA. lander@genome.wi.mit.edu
  • 41. • The human genome holds an extraordinary trove of information about human development, physiology, medicine and evolution. Here we report the results of an international collaboration to produce and make freely available a draft sequence of the human genome. We also present an initial analysis of the data, describing some of the insights that can be gleaned from the sequence. • Here we report the results of a collaboration involving 20 groups from the United States, the United Kingdom, Japan, France, Germany and China to produce a draft sequence of the human genome. • Of course, navigating information spanning nearly ten orders of magnitude requires computational tools to extract the full value.
  • 42. FIGURA 1. Línea de tiempo de los análisis genómicos a gran escala. Nature 409, 860-921(15 February 2001)doi:10.1038/35057062 http://www.nature.com/nature/journal/v409/n6822/fig_tab/409860a0_F1.html
  • 43. FIGURE 3. The automated production line for sample preparation at the Whitehead Institute, Center for Genome Research. Nature 409, 860-921(15 February 2001)doi:10.1038/35057062 http://www.nature.com/nature/journal/v409/n6822/images/409860ac.2.jpg
  • 44. Science 16 February 2001: Vol. 291. no. 5507, pp. 1304 - 1351 DOI: 10.1126/science.1058040 • REVIEW • The Sequence of the Human Genome • J. Craig Venter,1* Mark D. Adams,1 Eugene W. Myers,1 Peter W. Li,1 Richard J. Mural,1 Granger G. Sutton,1 Hamilton O. Smith,1 Mark Yandell,1 Cheryl A. Evans,1Robert A. Holt,1 Jeannine D. Gocayne,1 Peter Amanatides,1 Richard M. Ballew,1 Daniel H. Huson,1 Jennifer Russo Wortman,1 Qing Zhang,1Chinnappa D. Kodira,1 Xiangqun H. Zheng,1 Lin Chen,1 Marian Skupski,1 Gangadharan Subramanian,1 Paul D. Thomas,1 Jinghui Zhang,1George L. Gabor Miklos,2 Catherine Nelson,3 Samuel Broder,1 Andrew G. Clark,4 Joe Nadeau,5 Victor A. McKusick,6 Norton Zinder,7 Arnold J. Levine,7Richard J. Roberts,8 Mel Simon,9 Carolyn Slayman,10 Michael Hunkapiller,11 Randall Bolanos,1 Arthur Delcher,1 Ian Dew,1 Daniel Fasulo,1 Michael Flanigan,1Liliana Florea,1 Aaron Halpern,1 Sridhar Hannenhalli,1 Saul Kravitz,1 Samuel Levy,1 Clark Mobarry,1 Knut Reinert,1 Karin Remington,1 Jane Abu-Threideh,1Ellen Beasley,1 Kendra Biddick,1 Vivien Bonazzi,1 Rhonda Brandon,1 Michele Cargill,1 Ishwar Chandramouliswaran,1 Rosane Charlab,1 Kabir Chaturvedi,1Zuoming Deng,1 Valentina Di Francesco,1 Patrick Dunn,1 Karen Eilbeck,1 Carlos Evangelista,1 Andrei E. Gabrielian,1 Weiniu Gan,1 Wangmao Ge,1Fangcheng Gong,1 Zhiping Gu,1 Ping Guan,1 Thomas J. Heiman,1 Maureen E. Higgins,1 Rui-Ru Ji,1 Zhaoxi Ke,1 Karen A. Ketchum,1 Zhongwu Lai,1 Yiding Lei,1Zhenya Li,1 Jiayin Li,1 Yong Liang,1 Xiaoying Lin,1 Fu Lu,1 Gennady V. Merkulov,1 Natalia Milshina,1 Helen M. Moore,1 Ashwinikumar K Naik,1Vaibhav A. Narayan,1 Beena Neelam,1 Deborah Nusskern,1 Douglas B. Rusch,1 Steven Salzberg,12 Wei Shao,1 Bixiong Shue,1 Jingtao Sun,1 Zhen Yuan Wang,1Aihui Wang,1 Xin Wang,1 Jian Wang,1 Ming-Hui Wei,1 Ron Wides,13 Chunlin Xiao,1 Chunhua Yan,1 Alison Yao,1 Jane Ye,1 Ming Zhan,1 Weiqing Zhang,1Hongyu Zhang,1 Qi Zhao,1 Liansheng Zheng,1 Fei Zhong,1 Wenyan Zhong,1 Shiaoping C. Zhu,1 Shaying Zhao,12 Dennis Gilbert,1 Suzanna Baumhueter,1Gene Spier,1 Christine Carter,1 Anibal Cravchik,1 Trevor Woodage,1 Feroze Ali,1 Huijin An,1 Aderonke Awe,1 Danita Baldwin,1 Holly Baden,1 Mary Barnstead,1Ian Barrow,1 Karen Beeson,1 Dana Busam,1 Amy Carver,1 Angela Center,1 Ming Lai Cheng,1 Liz Curry,1 Steve Danaher,1 Lionel Davenport,1 Raymond Desilets,1Susanne Dietz,1 Kristina Dodson,1 Lisa Doup,1 Steven Ferriera,1 Neha Garg,1 Andres Gluecksmann,1 Brit Hart,1 Jason Haynes,1 Charles Haynes,1 Cheryl Heiner,1Suzanne Hladun,1 Damon Hostin,1 Jarrett Houck,1 Timothy Howland,1 Chinyere Ibegwam,1 Jeffery Johnson,1 Francis Kalush,1 Lesley Kline,1 Shashi Koduru,1Amy Love,1 Felecia Mann,1 David May,1 Steven McCawley,1 Tina McIntosh,1 Ivy McMullen,1 Mee Moy,1 Linda Moy,1 Brian Murphy,1 Keith Nelson,1Cynthia Pfannkoch,1 Eric Pratts,1 Vinita Puri,1 Hina Qureshi,1 Matthew Reardon,1 Robert Rodriguez,1 Yu-Hui Rogers,1 Deanna Romblad,1 Bob Ruhfel,1Richard Scott,1 Cynthia Sitter,1 Michelle Smallwood,1 Erin Stewart,1 Renee Strong,1 Ellen Suh,1 Reginald Thomas,1 Ni Ni Tint,1 Sukyee Tse,1 Claire Vech,1Gary Wang,1 Jeremy Wetter,1 Sherita Williams,1 Monica Williams,1 Sandra Windsor,1 Emily Winn-Deen,1 Keriellen Wolfe,1 Jayshree Zaveri,1 Karena Zaveri,1Josep F. Abril,14 Roderic Guigó,14 Michael J. Campbell,1 Kimmen V. Sjolander,1 Brian Karlak,1 Anish Kejariwal,1 Huaiyu Mi,1 Betty Lazareva,1 Thomas Hatton,1Apurva Narechania,1 Karen Diemer,1 Anushya Muruganujan,1 Nan Guo,1 Shinji Sato,1 Vineet Bafna,1 Sorin Istrail,1 Ross Lippert,1 Russell Schwartz,1Brian Walenz,1 Shibu Yooseph,1 David Allen,1 Anand Basu,1 James Baxendale,1 Louis Blick,1 Marcelo Caminha,1 John Carnes-Stine,1 Parris Caulk,1Yen-Hui Chiang,1 My Coyne,1 Carl Dahlke,1 Anne Deslattes Mays,1 Maria Dombroski,1 Michael Donnelly,1 Dale Ely,1 Shiva Esparham,1 Carl Fosler,1 Harold Gire,1Stephen Glanowski,1 Kenneth Glasser,1 Anna Glodek,1 Mark Gorokhov,1 Ken Graham,1 Barry Gropman,1 Michael Harris,1 Jeremy Heil,1 Scott Henderson,1Jeffrey Hoover,1 Donald Jennings,1 Catherine Jordan,1 James Jordan,1 John Kasha,1 Leonid Kagan,1 Cheryl Kraft,1 Alexander Levitsky,1 Mark Lewis,1Xiangjun Liu,1 John Lopez,1 Daniel Ma,1 William Majoros,1 Joe McDaniel,1 Sean Murphy,1 Matthew Newman,1 Trung Nguyen,1 Ngoc Nguyen,1 Marc Nodell,1Sue Pan,1 Jim Peck,1 Marshall Peterson,1 William Rowe,1 Robert Sanders,1 John Scott,1 Michael Simpson,1 Thomas Smith,1 Arlan Sprague,1Timothy Stockwell,1 Russell Turner,1 Eli Venter,1 Mei Wang,1 Meiyuan Wen,1 David Wu,1 Mitchell Wu,1 Ashley Xia,1 Ali Zandieh,1 Xiaohong Zhu1
  • 45. A 2.91-billion base pair (bp) consensus sequence of the euchromatic portion of the human genome was generated by the whole-genome shotgun sequencing method. The 14.8-billion bp DNA sequence was generated over 9 months from 27,271,853 high-quality sequence reads (5.11-fold coverage of the genome) from both ends of plasmid clones made from the DNA of five individuals. Two assembly strategies--a whole-genome assembly and a regional chromosome assembly--were used, each combining sequence data from Celera and the publicly funded genome effort. The public data were shredded into 550-bp segments to create a 2.9-fold coverage of those genome regions that had been sequenced, without including biases inherent in the cloning and assembly procedure used by the publicly funded group. This brought the effective coverage in the assemblies toeightfold, reducing the number and size of gaps in the final assembly over what would be obtained with 5.11-fold coverage. The two assembly strategies yielded very similar results that largely agree with independent mapping data. The assemblies effectively cover the euchromatic regions of the human chromosomes. More than 90% of the genome is in scaffold assemblies of 100,000 bp or more, and 25% of the genome is in scaffolds of 10 million bp or larger. Analysis of the genome sequence revealed 26,588 protein-encoding transcripts for which there was strong corroborating evidence and an additional ~12,000 computationally derived genes with mouse matches or other weak supporting evidence. Although gene-dense clusters are obvious, almost half the genes are dispersed in low G+C sequence separated by large tracts of apparently noncoding sequence. Only 1.1% of the genome is spanned by exons, whereas 24% is in introns, with 75% of the genome being intergenic DNA. Duplications of segmental blocks, ranging in size up to chromosomal lengths, are abundant throughout the genome and reveal a complex evolutionary history. Comparative genomic analysis indicates vertebrate expansions of genes associated with neuronal function, with tissue-specific developmental regulation, and with the hemostasis and immune systems. DNA sequence comparisons between the consensus sequence and publicly funded genome data provided locations of 2.1 million single-nucleotide polymorphisms (SNPs). A random pair of human haploid genomes differed at a rate of 1 bp per 1250 on average, but there was marked heterogeneity in the level of polymorphism across the genome. Less than 1% of all SNPs resulted in variation in proteins, but the task of determining which SNPs have functional consequences remains an open challenge.
  • 46. Fig. 2. Flow diagram for sequencing pipeline. Samples are received, selected, and processed in compliance with standard operating procedures, with a focus on quality within and across departments. Each process has defined inputs and outputs with the capability to exchange samples and data with both internal and external entities according to defined quality guidelines. Manufacturing pipeline processes, products, quality control measures, and responsible parties are indicated and are described further in the text. J. C. Venter et al., Science 291, 1304 -1351 (2001)
  • 49.
  • 50.
  • 51. OMICS • Los estudios “omics” están involucrados en el análisis de cantidades grandes de parámetros, generalmente proteínas (proteomics), lípidos (lipidomics) y metabolitos (metabolomics). El término “omics” deriva del sufijo griego “ome” que significa muchos o masa. Las mediciones se hacen a base de marcadores químicos que son indicativos de algún evento biológico (biomarkers). Los valores asociados con los parámetros medidos son investigados con el fin de encontrar una correlación con enfermedades. Cuando los objetos de investigación son proteinas, genes y metabolitos, las aproximaciones correspondientes son proteomics, genomics y metabolommics. • En años recientes, con el desarrollado de métodos para medir y analizar un número muy grande de analitos de una sola muestra, se ha popularizado las investigaciones que intentan medir miles de parámetros en vez de sólo unos cuantos. Esta aproximación es la que dio pie a los experimentos modernos de “omics.” • La meta final de las aproximaciones “omics” es comprender comprehensiva e integralmente los procesos biológicos, mediante la identificación y correlación de varios “jugadores” (e.g. genes, RNA, proteínas, metabolitos) en vez de estudiar cada uno de ellos de manera individual. • Lamentablemente, un estudio sobre la probabilidad de reproducir investigaciones en "genomics" (asociar grupos de genes con enfermedades complejas), en el cual se compararon 370 estudios, reveló una alta frecuencia de investigaciones subsecuentes que no confirmaban los descubrimientos iniciales. Debido al enorme número de mediciones y el número limitado de muestras de investigación, surgen problemas relacionados a la estadística, el sesgo, la metodología y el uso inadecuado del método. • • Layjr, J., Liyanage, R., Borgmann, S., & Wilkins, C. (2006). Problems with the “omics”. TrAC Trends in Analytical Chemistry, 25(11), 1046-1056. doi: 10.1016/j.trac.2006.10.007.
  • 52. OMIC’S ARTICULO Genomics 'Genomics': buzzword or reality? http://view.ncbi.nlm.nih.gov/pubmed/10343163 Metabolomics Metabolomic http://www.benthamdirect.org/pages/content.php?CDM/2008/00000009/00000001/0011F.SGM Proteomics Proteomics http://dx.doi.org/10.1097/01.mnh.0000079691.89474.ee Transcriptomics Transcriptomics http://view.ncbi.nlm.nih.gov/pubmed/18336229 Vaccinomics Vaccinomics http://www.gtmb.org/VOL12B/PDF/16._Gomase_&_Tagore,_141-146.pdf Oncogenomics Oncogenomics http://www.ncbi.nlm.nih.gov/pubmed/18336222 Pharmacogenomics Pharmacogenomics http://www.ncbi.nlm.nih.gov/pubmed/18336223 Epigenomics Epigenomics. http://www.ncbi.nlm.nih.gov/pubmed/18336226 Toxicogenomics Toxicogenomics. http://www.ncbi.nlm.nih.gov/pubmed/18336230 Kinomics Kinomics http://www.ncbi.nlm.nih.gov/pubmed/18336231 Physiomics Physiomics http://www.ncbi.nlm.nih.gov/pubmed/18336232 Cytomics Cytomics http://www.ncbi.nlm.nih.gov/pubmed/18336233 Postgenomics Tracking the shift to 'postgenomics' http://dx.doi.org/10.1159/000092656 Glycomics Probing glycomics http://dx.doi.org/10.1016/j.cbpa.2006.11.040 Lipidomics Lipidomics is emerging. http://view.ncbi.nlm.nih.gov/pubmed/14643793 Cellunomic Cellunomics: the interaction analysis of cells http://view.ncbi.nlm.nih.gov/pubmed/19887340 Phylogenomics Phylogenomics: evolution and genomics intersection http://view.ncbi.nlm.nih.gov/pubmed/19778869
  • 54. • Este proyecto se lleva a cabo gracias al financiamiento de: DGAPA, UNAM Proyecto PAPIME PE 201509
  • 55. Agradecimientos • Laura Montoya • Lourdes Valencia • Fernando Galicia • Roberto Calderón • Lyssania Macías
  • 56. No se nos ha escapado a nuestra atención que cuánto más exploramos el genoma humano, más nos queda por explorar. "No cesaremos de explorar. Pues al final de toda exploración llegaremos donde empezamos, y conoceremos cuál es nuestro lugar por primera vez“ Thomas Stearns, Eliot, 2001