SlideShare uma empresa Scribd logo
1 de 30
Secuenciación del ADN. Metodologías e
interpretación. Comparación de
secuencias. Filogenia y Filogenómica
Dra. M. Julia Althabegoiti.
IBBM, Facultad de Ciencias Exactas, UNLP-CONICET
ELEMENTOS DE GENETICA VEGETAL EN LA PROTECCION DE
CULTIVOS
Secuenciación del ADN
* Método químico de Maxam Y Gilbert
* Método de Sanger
1953- Watson & Crick: Double Helix Structure of DNA
1977- Métodos de secuenciación basados en el
conocimiendo de la estructura del ADN
Método de Sanger
3´
+dNTP
+ PPi
Se obtiene la
secuencia de la
cadena
complementaria
Electroforesis en gel
de acrilamida
Secuencia de dos fragmentos de ADN del bacteriófago 
X174 empleando diferentes “primers”
Sanger et al., 1977
Secuenciadores de primera
generación
En resumen..
Secuenciadores de segunda
generación
Roche
454-FLX
Applied Biosystems
SOLID
Illumina
• Permiten la secuenciación de millones de fragmentos en paralelo,
secuencias relativamente cortas de 100 pb (illumina) a 400 pb (454-
FLX)
• Son más económicos y permiten realizar secuenciacion de genomas o
transcriptomas completos.
Secuenciadores de tercera
generación
Pacific Bioscience Oxford Nanopore
Ventajas
• Lecturas largas (1500 pb). Facilita el ensamblado
Desventajas
• No se requiere amplificación, secuenciación en tiempo real
• Detecta modificaciones de nt
• Costo alto
• Alta tasa de errores
Ejemplos:
• Secuenciación por Sanger: la muestra que se envía es una PCR
(Reacción de la Polimerasa en Cadena) del fragmento que se quiere
secuenciar o bien un plásmido con el mismo fragmento clonado. Si
se puede se realiza la secuenciación por ambos extremos, para tener
ambas secuencias.
*.txt: secuencia de bases
*.ab1: tiene tanto la secuencia como el cromatograma y la secuencia
*.pdf: se puede ver de forma sencilla el cromatograma
Resultados:
• Secuenciación por illumina HiSeq2000 de un genoma
bacteriano, se envía el ADN total de la bacteria. Disponemos de
un genoma molde, sólo se buscaban mutaciones, y pequeñas
deleciones o inserciones.
Se realiza una fragmentación del ADN y una biblioteca genómica
con kits comerciales
Resultados
3004_1.fastq.gz (1,5Gb)
3004_2.fastq.gz (1,6Gb)
Datos comprimidos de
todas las lecturas de cada
fragmento.
Coverage
(Mapped Reads*read length/ Ref. size)
Flujo de trabajo
Tipos de alineamientos
1. Locales o Globales
2. De a pares (pairwise) o múltiples (globales)
Comparación de secuencias
Usan diferentes algoritmos
Un alineamiento global fuerza el alineamiento de ambas
secuencias a lo largo de toda su longitud. Usamos aln.
globales cuando estamos seguros de que la homologia se
extiende a lo largo de todas las secuencias a comparar. Este
es el tipo de alineamientos que generan programas de
alineamiento múltiple tales como Clustal, T-Coffee o Muscle.
Pero ese algoritmo es muy lento. El tiempo de cálculo es
proporcional al producto de las longitudes de las dos secuencias
que se quieren alinear (o al producto de la longitud de nuestra
secuencia problema y la de todas las secuencias de la base de
datos).
2. De a pares (pairwise) o múltiples (Globales)
El alineamiento secuencial es un procedimiento por el cual
podemos comparar 2 (alineamiento entre pares, pair-wise
alignment) o más secuencias (alineamiento múltiple, multiple
alignment)..
Los caracteres idénticos (o similares) se ubican en la misma
columna, mientras que los caracteres no-idénticos se pueden
ubicar en la misma columna o bien alineados con lo que
llamamos “gap”.
Los algoritmos de alineamiento local son mucho
más rápidos.
El alineamiento se trata de extender en los dos sentidos
BLAST (Basic Local Alignment Search
Tool)
BLAST utiliza la secuencia de entrada “query” y las de la bases de
datos, busca alineamientos locales con alta puntuación (HSPs o high-
scoring pairs).
Al ser un algoritmo más rápido permite hacer una
búsqueda de secuencias similares en la base de
datos.
En la evaluación del alineamiento entre cada par de secuencias se
generan ciertos valores que dan un peso estadístico al
alineamiento.
Valor E: probabilidad de que la similitud encontrada se deba
al azar
Valor E: probabilidad de que la identidad encontrada se deba a
azar
• Se pueden buscar homólogos en las bases de
datos para realizar las filogenias
• Problema: hay cantidad de información en muchos
casos repetida; en otros cosos muchas secuencias de
la misma especie y en algunos casos especies mal
anotadas.
• Muchas bases de datos no son curadas.
Filogenia
La filogenia estudia las relaciones evolutivas entre los
organismos y trata de establecer líneas donde se refleje la
descendencia y grado de parentesco entre unos y otros
grupos de individuos.
El desarrollo de la genética ha permitido estudiar las
diferencias y similitudes en las cadenas de ADN de cada
especie y la evolución de las mismas responde a las
mutaciones del ADN.
1. Seleccionar las secuencias a analizar, tomadas de las bases
de datos u obtenidas por PCR y secuenciación.
2. Alineamiento múltiple (global) de esas secuencias
3. Elegir el método para la construcción de árboles filogenéticos:
Métodos de distancia: utilizan matrices de distancia.
* Neighbour Joining.
Métodos discretos : trabajan directamente con las secuencias
* Máxima verosimilitud (Maximum likelihood).
* Maxima Parsimonia.
4. Evaluar estadísticamente el árbol filogenético obtenido.
El test más simple para probar si el conjunto de datos “soportan”
el árbol obtenido es el del bootstrap.
Como construir un árbol filogenético
1) 16SARN (ARN de la subunidad menor del ribosoma)
- baja tasa de evolución: poca resolución
- permite trabajar con bacterias no cultivables
- múltiples copias: puede haber hasta 5% variación intragenómica
2) MLSA (Multilocus sequence analysis) con genes
housekeeping, secuencias concatenadas:
- presentes en todos los taxones/grupos
- mayor tasa de evolución que el 16SRNA
- pertenecen al core genome
Taxonomía bacteriana
No todos los genes evolucionan con la misma tasa
MLSA con secuencias de genes del flagelo 14
CDSs - fliR, flhA, fliQ, flaF, fliF, fliP, flgH, flgI, flgG,
fliE, flgC, flgB, flhB, fliG. Maximum-likelihood,
Tamura-Nei, 1000 bootstrap replicates.
3 clusters
o Flagelo subpolar
o Flagelo lateral de
Bradyrhizobios
o Flagelo lateral de Rhizobios
3) Filogenómica: estudia las relaciones evolutivas
basadas en el análisis de genomas completos.
GBDP (Genome Blast Distance Phylogeny): basado en el
alineamiento de a pares genomas, generando las HSPs
intergenómicos, y por medio de un algoritmo se transforman en el valor
“genome to genome distance” (Meier-Kolthoff et al., 2013). Luego los
árboles filogenéticos son inferidos por estas matrices de distancia.
http://ggdc.dsmz.de/ggdc.php
ANI (Average Nucleotide
Identity)
se fragmenta el genoma in silico
(de a 1020 pb) para luego realizar
los alineamientos
ANIm: Usa el MUMmer para alinear
ANIb: Usa el BlastN para alinear
Se generan matrices de distancia empleando estos valores para luego
armar un árbol.
Arbol filogenómico por NJ (de distancia) basado en las
distancias intergenómicas de 128 genomas de
Bradyrhizobium.
¿Preguntas?
Muchas gracias

Mais conteúdo relacionado

Semelhante a clase althabefoiti sobre el secuenciamiento del DNA

Teoría sobre la prediccion de genessssss
Teoría sobre la prediccion de genessssssTeoría sobre la prediccion de genessssss
Teoría sobre la prediccion de genessssssluisman9119
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humanoElton Volitzki
 
Tecnología Adn Recombinante 2003
Tecnología Adn Recombinante 2003Tecnología Adn Recombinante 2003
Tecnología Adn Recombinante 2003Cristela
 
Genes y genomas. El ADN que forma el genoma de los organismos.pdf
Genes y genomas. El ADN que forma el genoma de  los organismos.pdfGenes y genomas. El ADN que forma el genoma de  los organismos.pdf
Genes y genomas. El ADN que forma el genoma de los organismos.pdfjhazpeitia
 
Secuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionSecuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionoxaljayos1
 
Leticia ines morales quispe
Leticia ines morales quispeLeticia ines morales quispe
Leticia ines morales quispeleticiamorales38
 
EXPRESIÓN DEL ADN SANTIAGO ANDRADE
EXPRESIÓN DEL ADN SANTIAGO ANDRADEEXPRESIÓN DEL ADN SANTIAGO ANDRADE
EXPRESIÓN DEL ADN SANTIAGO ANDRADESANTIAGO ANDRADE
 
Respuestas - Cuestionario Tema 3.pdf
Respuestas - Cuestionario Tema 3.pdfRespuestas - Cuestionario Tema 3.pdf
Respuestas - Cuestionario Tema 3.pdfRembert Cari Hojeda
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humanoElton Volitzki
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humanoElton Volitzki
 
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap GeneSimulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap GeneBrayan Chipana
 
Secuencias Genoma.ppt
Secuencias Genoma.pptSecuencias Genoma.ppt
Secuencias Genoma.pptDavid Rosales
 
Tecnologia Del Adn Recombinante3
Tecnologia Del Adn Recombinante3Tecnologia Del Adn Recombinante3
Tecnologia Del Adn Recombinante3guest350e39c
 
D912f51131ed787b91.en.es
D912f51131ed787b91.en.esD912f51131ed787b91.en.es
D912f51131ed787b91.en.esJaime Paredes
 

Semelhante a clase althabefoiti sobre el secuenciamiento del DNA (20)

Teoría sobre la prediccion de genessssss
Teoría sobre la prediccion de genessssssTeoría sobre la prediccion de genessssss
Teoría sobre la prediccion de genessssss
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humano
 
Tecnología Adn Recombinante 2003
Tecnología Adn Recombinante 2003Tecnología Adn Recombinante 2003
Tecnología Adn Recombinante 2003
 
Transcriptomica PDF
Transcriptomica PDFTranscriptomica PDF
Transcriptomica PDF
 
Genes y genomas. El ADN que forma el genoma de los organismos.pdf
Genes y genomas. El ADN que forma el genoma de  los organismos.pdfGenes y genomas. El ADN que forma el genoma de  los organismos.pdf
Genes y genomas. El ADN que forma el genoma de los organismos.pdf
 
Secuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionSecuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacion
 
Leticia ines morales quispe
Leticia ines morales quispeLeticia ines morales quispe
Leticia ines morales quispe
 
T5 genoma humano
T5 genoma humanoT5 genoma humano
T5 genoma humano
 
EXPRESIÓN DEL ADN SANTIAGO ANDRADE
EXPRESIÓN DEL ADN SANTIAGO ANDRADEEXPRESIÓN DEL ADN SANTIAGO ANDRADE
EXPRESIÓN DEL ADN SANTIAGO ANDRADE
 
Biologia del adn
Biologia del adnBiologia del adn
Biologia del adn
 
Respuestas - Cuestionario Tema 3.pdf
Respuestas - Cuestionario Tema 3.pdfRespuestas - Cuestionario Tema 3.pdf
Respuestas - Cuestionario Tema 3.pdf
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humano
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humano
 
Dna y organizacion genomica
Dna y organizacion genomicaDna y organizacion genomica
Dna y organizacion genomica
 
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap GeneSimulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
 
Secuencias Genoma.ppt
Secuencias Genoma.pptSecuencias Genoma.ppt
Secuencias Genoma.ppt
 
Tecnologia Del Adn Recombinante3
Tecnologia Del Adn Recombinante3Tecnologia Del Adn Recombinante3
Tecnologia Del Adn Recombinante3
 
Secuenciacion ADN
Secuenciacion ADNSecuenciacion ADN
Secuenciacion ADN
 
Alineamiento
AlineamientoAlineamiento
Alineamiento
 
D912f51131ed787b91.en.es
D912f51131ed787b91.en.esD912f51131ed787b91.en.es
D912f51131ed787b91.en.es
 

Último

proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoFundación YOD YOD
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxMaritzaRetamozoVera
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdfBaker Publishing Company
 
Ecosistemas Natural, Rural y urbano 2021.pptx
Ecosistemas Natural, Rural y urbano  2021.pptxEcosistemas Natural, Rural y urbano  2021.pptx
Ecosistemas Natural, Rural y urbano 2021.pptxolgakaterin
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.amayarogel
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arteRaquel Martín Contreras
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptxFelicitasAsuncionDia
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxKarlaMassielMartinez
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosCesarFernandez937857
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxPryhaSalam
 

Último (20)

proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativo
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docx
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf
 
Power Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptxPower Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptx
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
Ecosistemas Natural, Rural y urbano 2021.pptx
Ecosistemas Natural, Rural y urbano  2021.pptxEcosistemas Natural, Rural y urbano  2021.pptx
Ecosistemas Natural, Rural y urbano 2021.pptx
 
Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arte
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos Básicos
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
 

clase althabefoiti sobre el secuenciamiento del DNA

  • 1. Secuenciación del ADN. Metodologías e interpretación. Comparación de secuencias. Filogenia y Filogenómica Dra. M. Julia Althabegoiti. IBBM, Facultad de Ciencias Exactas, UNLP-CONICET ELEMENTOS DE GENETICA VEGETAL EN LA PROTECCION DE CULTIVOS
  • 2. Secuenciación del ADN * Método químico de Maxam Y Gilbert * Método de Sanger 1953- Watson & Crick: Double Helix Structure of DNA 1977- Métodos de secuenciación basados en el conocimiendo de la estructura del ADN
  • 3. Método de Sanger 3´ +dNTP + PPi Se obtiene la secuencia de la cadena complementaria Electroforesis en gel de acrilamida
  • 4. Secuencia de dos fragmentos de ADN del bacteriófago  X174 empleando diferentes “primers” Sanger et al., 1977
  • 5.
  • 7. Secuenciadores de segunda generación Roche 454-FLX Applied Biosystems SOLID Illumina • Permiten la secuenciación de millones de fragmentos en paralelo, secuencias relativamente cortas de 100 pb (illumina) a 400 pb (454- FLX) • Son más económicos y permiten realizar secuenciacion de genomas o transcriptomas completos.
  • 9. Ventajas • Lecturas largas (1500 pb). Facilita el ensamblado Desventajas • No se requiere amplificación, secuenciación en tiempo real • Detecta modificaciones de nt • Costo alto • Alta tasa de errores
  • 10. Ejemplos: • Secuenciación por Sanger: la muestra que se envía es una PCR (Reacción de la Polimerasa en Cadena) del fragmento que se quiere secuenciar o bien un plásmido con el mismo fragmento clonado. Si se puede se realiza la secuenciación por ambos extremos, para tener ambas secuencias. *.txt: secuencia de bases *.ab1: tiene tanto la secuencia como el cromatograma y la secuencia *.pdf: se puede ver de forma sencilla el cromatograma Resultados:
  • 11. • Secuenciación por illumina HiSeq2000 de un genoma bacteriano, se envía el ADN total de la bacteria. Disponemos de un genoma molde, sólo se buscaban mutaciones, y pequeñas deleciones o inserciones. Se realiza una fragmentación del ADN y una biblioteca genómica con kits comerciales
  • 12. Resultados 3004_1.fastq.gz (1,5Gb) 3004_2.fastq.gz (1,6Gb) Datos comprimidos de todas las lecturas de cada fragmento. Coverage (Mapped Reads*read length/ Ref. size) Flujo de trabajo
  • 13. Tipos de alineamientos 1. Locales o Globales 2. De a pares (pairwise) o múltiples (globales) Comparación de secuencias Usan diferentes algoritmos
  • 14. Un alineamiento global fuerza el alineamiento de ambas secuencias a lo largo de toda su longitud. Usamos aln. globales cuando estamos seguros de que la homologia se extiende a lo largo de todas las secuencias a comparar. Este es el tipo de alineamientos que generan programas de alineamiento múltiple tales como Clustal, T-Coffee o Muscle. Pero ese algoritmo es muy lento. El tiempo de cálculo es proporcional al producto de las longitudes de las dos secuencias que se quieren alinear (o al producto de la longitud de nuestra secuencia problema y la de todas las secuencias de la base de datos).
  • 15. 2. De a pares (pairwise) o múltiples (Globales) El alineamiento secuencial es un procedimiento por el cual podemos comparar 2 (alineamiento entre pares, pair-wise alignment) o más secuencias (alineamiento múltiple, multiple alignment).. Los caracteres idénticos (o similares) se ubican en la misma columna, mientras que los caracteres no-idénticos se pueden ubicar en la misma columna o bien alineados con lo que llamamos “gap”. Los algoritmos de alineamiento local son mucho más rápidos.
  • 16. El alineamiento se trata de extender en los dos sentidos BLAST (Basic Local Alignment Search Tool) BLAST utiliza la secuencia de entrada “query” y las de la bases de datos, busca alineamientos locales con alta puntuación (HSPs o high- scoring pairs). Al ser un algoritmo más rápido permite hacer una búsqueda de secuencias similares en la base de datos.
  • 17. En la evaluación del alineamiento entre cada par de secuencias se generan ciertos valores que dan un peso estadístico al alineamiento. Valor E: probabilidad de que la similitud encontrada se deba al azar
  • 18.
  • 19.
  • 20.
  • 21. Valor E: probabilidad de que la identidad encontrada se deba a azar
  • 22.
  • 23. • Se pueden buscar homólogos en las bases de datos para realizar las filogenias • Problema: hay cantidad de información en muchos casos repetida; en otros cosos muchas secuencias de la misma especie y en algunos casos especies mal anotadas. • Muchas bases de datos no son curadas.
  • 24. Filogenia La filogenia estudia las relaciones evolutivas entre los organismos y trata de establecer líneas donde se refleje la descendencia y grado de parentesco entre unos y otros grupos de individuos. El desarrollo de la genética ha permitido estudiar las diferencias y similitudes en las cadenas de ADN de cada especie y la evolución de las mismas responde a las mutaciones del ADN.
  • 25. 1. Seleccionar las secuencias a analizar, tomadas de las bases de datos u obtenidas por PCR y secuenciación. 2. Alineamiento múltiple (global) de esas secuencias 3. Elegir el método para la construcción de árboles filogenéticos: Métodos de distancia: utilizan matrices de distancia. * Neighbour Joining. Métodos discretos : trabajan directamente con las secuencias * Máxima verosimilitud (Maximum likelihood). * Maxima Parsimonia. 4. Evaluar estadísticamente el árbol filogenético obtenido. El test más simple para probar si el conjunto de datos “soportan” el árbol obtenido es el del bootstrap. Como construir un árbol filogenético
  • 26. 1) 16SARN (ARN de la subunidad menor del ribosoma) - baja tasa de evolución: poca resolución - permite trabajar con bacterias no cultivables - múltiples copias: puede haber hasta 5% variación intragenómica 2) MLSA (Multilocus sequence analysis) con genes housekeeping, secuencias concatenadas: - presentes en todos los taxones/grupos - mayor tasa de evolución que el 16SRNA - pertenecen al core genome Taxonomía bacteriana No todos los genes evolucionan con la misma tasa
  • 27. MLSA con secuencias de genes del flagelo 14 CDSs - fliR, flhA, fliQ, flaF, fliF, fliP, flgH, flgI, flgG, fliE, flgC, flgB, flhB, fliG. Maximum-likelihood, Tamura-Nei, 1000 bootstrap replicates. 3 clusters o Flagelo subpolar o Flagelo lateral de Bradyrhizobios o Flagelo lateral de Rhizobios
  • 28. 3) Filogenómica: estudia las relaciones evolutivas basadas en el análisis de genomas completos. GBDP (Genome Blast Distance Phylogeny): basado en el alineamiento de a pares genomas, generando las HSPs intergenómicos, y por medio de un algoritmo se transforman en el valor “genome to genome distance” (Meier-Kolthoff et al., 2013). Luego los árboles filogenéticos son inferidos por estas matrices de distancia. http://ggdc.dsmz.de/ggdc.php ANI (Average Nucleotide Identity) se fragmenta el genoma in silico (de a 1020 pb) para luego realizar los alineamientos ANIm: Usa el MUMmer para alinear ANIb: Usa el BlastN para alinear Se generan matrices de distancia empleando estos valores para luego armar un árbol.
  • 29. Arbol filogenómico por NJ (de distancia) basado en las distancias intergenómicas de 128 genomas de Bradyrhizobium.

Notas do Editor

  1. Maxman: Un fragmento de ADN se marca radiactivamente en sus extremos con gamma 32P ó gamma 32S dATP por acción de la polinucleótido quinasa. La técnica consiste en romper estas moléculas marcadas con reacciones químicas específicas para cada una de las cuatro bases. Cuatro alícuotas de la misma muestra se tratan bajo condiciones distintas, posteriormente el tratamiento con piperidina rompe la molécula de ADN a nivel de la base modificada. Los productos de estas cuatro reacciones se resuelven en función de su tamaño en geles de poliacrilamida donde la secuencia puefe leerse en base al patrón de bandas radiactivas obtenidas. Esta técnica permite la lectura de unas 100 bases de secuencia
  2. Hasta 200 pb
  3. Raw data: Una coleccion de secuencias que se tiene en cada cluster al final de la secuenciación.
  4. The Genome Blast Distance Phylogeny approach (GBDP) was originally devised as an approach for the inference of phylogenetic trees or networks from a given set of wholly (or even incompletely) sequenced genomes [12], and was subsequently revisited and enhanced [8,13-16]. The underlying principle is as follows: in the first step two genomes A and B are locally aligned using tools such as BLAST [17], which produce a set of high-scoring segment pairs (HSPs; these are intergenomic matches). In the second step, information contained in these HSPs (e.g., the total number of identical base pairs) is transformed into a single genome-to-genome distance value by the use of a specific distance formula. Phylogenetic trees can then be inferred from such distance matrices using standard techniques such as neighbour joining