4. Splicing.
O Splicing é um processo que remove os introns e junta os exons depois da
transcrição do RNA.
Ele consiste na retirada dos íntrons de um mRNA precursor, sendo um dos
processos necessários para formar um mRNA maduro funcional.
O splicing ocorre predominantemente em células eucarióticas, já que o DNA
das células procarióticas não possui introns.
HECHO POR LUCIA SENCIA 4
5. Splicing.
Essa excisão dos introns do mRNA é um evento muito
importante e requer uma extrema precisão das moléculas
envolvidas no processo. A exclusão ou o acréscimo de um único
nucleotídeo em um exon pode levar a uma alteração da
fase de leitura e à produção de uma proteína completamente
diferente da original ou defeituosa.
HECHO POR LUCIA SENCIA 5
7. Splicing.
Gene - um segmento de DNA ou RNA que
carrega a informação genética.
Exon - a região de um gene que é traduzido
em proteína.
Intron - uma região de um gene que não é
traduzido em proteína
Splicing – o processo no qual os introns
são removidos e exons são unidos para ser
traduzido em uma única proteína
HECHO POR LUCIA SENCIA 7
8. Um gene, uma proteína?
O nosso proteoma (o acervo protéico) apresenta ~100.000
proteínas!
Como o número de genes é inferior ~30.000, a resposta parece
estar no "splicing".
Em 1977 foi observado por Richard Roberts e Phillip Sharp que
um dado genes foi transcrito da mesma forma, mas resultou em
duas moléculas de RNA maduros diferentes. Cada uma delas
resultando em dois polipeptídios distintos que poderiam ter
funções distintas em momentos diferentes, ou em células
diferentes.
HECHO POR LUCIA SENCIA 8
10. Splicing Alternativo.
O processo pelo qual os exons de um pré-mRNA se
ligam de maneiras diferentes durante o splicing de RNA.
Splicing alternativo é um modo comum de regulação
dos genes dentro das células, sendo usado
por 90-95% dos genes humanos.
Ele pode alterar drasticamente a função de um gene
em diferentes tipos de tecidos ou mesmo inativar
o gene completamente .
Splicing alternativo está correlacionado com muitas
doenças. HECHO POR LUCIA SENCIA 10
14. 1- Splicing Alternativo.
-- Splicing.
-- Tipos de Splicing Alternativos.
-- Elementos Reguladores de Splicing.
2- Identificação e Anotação de Splicing
Alternativo.
-- Por Full-lengths e ESTs.
-- Por RNA-seq.
3- Splicing alternativo e diversidade genética.
HECHO POR LUCIA SENCIA 14
19. Full-lengths e ESTs.
GenBank Data
Year Base Pairs Sequences
2005 56,037,734,462 52,016,762
2006 69,019,290,705 64,893,747
2007 83,874,179,730 80,388,382
2008 99,116,431,942 98,868,465
HECHO POR LUCIA SENCIA 19
21. Next Generation Sequencing.
-Existem hoje no mercado 4 novos equipamentos de seqüenciamento,
os quais usam tecnologias diferentes caracterizadas pela grande
quantidade de dados produzidos.
-Duas dessas tecnologias (Illumina-GLX e SOLiD) geram dezenas ou
centena de gigabases de DNA por corrida.
-O processamento das seqüências geradas requerem demandas
computacionais cada vez mais significativas.
-Então sem o poder computacional adequado não se tem processamento
de dados e muito menos analise.
HECHO POR LUCIA SENCIA 21
22. Identificação de Splicing Alternativo por RNA-seq.
Não há uma maneira "correta" de
analisar dados RNA-seq .
Mas há dois métodos principais:
- Alinhamento direto de reads
(spliced ou unspliced) a um
genoma ou transcriptoma.
- Assembly dos reads seguido
por alinhamento.
HECHO POR LUCIA SENCIA 22
23. Background.
• A primeira tarefa após obter o seus reads (de qualquer plataforma) é
determinar o local correspondente no genoma de referência a partir do
qual cada um deles derivam.
Denominado alinhamento genômico ou "mapeamento“.
HECHO POR LUCIA SENCIA 23
24. Background.
Muitos dos alinhadores “next-gen” disponíveis, se valem de duas
principais abordagens :
• Genoma "indexado" na memória:
memória proporcional ao tamanho do genoma.
• Reads indexados na memória:
memória proporcional ao número reads.
• Informações de pareamento é usado para selecionar a colocação ideal
de reads como um par.
•Alguns podem permitir mais mismatches, alinhamento com gap.
HECHO POR LUCIA SENCIA 24
25. Background: Comuns convenções de alinhamento para next-gen.
• Multi-map reads (reads que podem ser alinhados em vários locais,
com pontuação igual) têm apenas um local relatado.
• Alguns alinhadores permite que todos os alinhamentos sejam relatados (ou
até um número máximo).
• Formato / detalhes do output de alinhamento variam
• Muitos grupos estão começando a padronizar para formato SAM
Representação eficiente de alinhamento
Recuperação rápida, compatível com os viewers next-gen
(por exemplo, IGV)
• Aquivo BAM é o ponto de partida para a maioria das análises .
HECHO POR LUCIA SENCIA 25
26. Background: Desvantagens para cada estratégia.
• Alinhamento no genoma.
computacionalmente caro.
Nunca é uma boa idéia simplesmente alinhar dados de RNA-seq no
genoma, precisa de alinhadores capazes de considera seqüências de junções
exon-exon no 'genoma').
• Alinhamento no transcriptoma.
Reads decorrentes de estruturas não-gênica podem ser "à força"
(e erroneamente) alinhado nos genes.
Valores incorretos expressão do gene.
Falsos positivos SNVS.
Muitos outros problemas potenciais.
3. Assembly.
Baixa expressão = difícil / impossível montar.
Contigs fragmentados devido à repeats requer grandes quantidades
de memória. HECHO POR LUCIA SENCIA 26
28. Background: Benefícios para cada estratégia.
• Alinhamento no genoma.
Permite o mapeamento de reads em locis não anotados.
Uma melhor definição dos introns.
Potencial para novas descobertas biológicas.
• Alinhamento no transcriptoma.
computacionalmente barato.
Spliced (exon junção) reads mapeado corretamente.
Reads pareados, distância e junção pode ajudar a distinguir isoformas.
9. Assembly.
Pode fornecer uma visão mais longa do transcrito.
Permite a detecção de transcritos quiméricos.
Não precisa necessariamente de um genoma.
HECHO POR LUCIA SENCIA 28
29. Por que não tratar RNA-seq reads como seqüências
de DNA genômico?
Reads que atravessam um ou mais junções exon-exon não vão alinhar
corretamente ao genoma.
Pares de reads terão distância de pareamento maior que o esperado.
HECHO POR LUCIA SENCIA 29
30. Construção das bases de dados usando informações
genéticas publicamente disponíveis.
mRNAs
ESTs
SAGE
Mutações Array
SNPs Integração
Ontologias
MPSS
OMIN
Dados genômicos
Dados de Illumina-GLX, Novas Tecnologias
SOLiD, 454-Roche. e novos desafios.
HECHO POR LUCIA SENCIA 30
31. BWA, BWA*
Novoalign, ABySS,
MOSAIK Velvet
Bowtie, TopHat
SpliceMap,
RNA-Mate,
QPALMA
Scripture Trans-ABySS
Cufflinks (uses BLAT)
ALEXA-Seq
Image from
HECHO POR LUCIA SENCIA Haas & Zody, 2010 31
32. 1- Splicing Alternativo.
-- Splicing.
-- Tipos de Splicing Alternativos.
-- Elementos Reguladores de Splicing.
2- Identificação e Anotação de Splicing
Alternativo.
-- Por Full-lengths e ESTs.
-- Por RNA-seq.
3- Splicing alternativo e diversidade genética.
HECHO POR LUCIA SENCIA 32
33. Neste estudo nós usamos variações de nucleotídeo único (SNV) e
dados de cDNAs para comparar a diversidade genética de ESRs
localizados em exons constitutivos e alternativos.
Nossos resultados mostram que variações no ESSs, e não em ESEs,
são mais comumente associados com splicing alternativo.
HECHO POR LUCIA SENCIA 33
34. Para esse estudo oito conjuntos de elementos reguladores (seis ESEs e dois ESSs) foram obtidos.
Quatro (SF2_IgM, SRP40, SRP55 e SC35) dos seis conjuntos de dados foram descobertos in
vitro, utilizando a metodologia SELEX enquanto os outros dois foram descobertas in silico.
HECHO POR LUCIA SENCIA 34
36. 1- Classificação dos exons.
2- Identificar os eventos de splicing.
3- Mapear os ESRs nos exons
4- Mapear os SNVs nos exons
5- Mapear SNVs exonicos em ESRs motifs publicos
6- Encontrar SNVs isoforma associada e definir ESR putativos
HECHO POR LUCIA SENCIA 36
37. 6- Encontrar SNVs isoforma associada e definir ESR putativos
HECHO POR LUCIA SENCIA 37
38. Primeiro achado:
A densidade de SNVs em exons alternativos é 10% superior quando
comparada com exos constitutivos (P-valor = 2,53-102 ).
Skipping = 5,01, Criptico = 5,19 e Retenção = 5,17 SNVS por 1000 nt.
Esta diversidade genética reduzida de exons skipping em relação a outras
formas de exons alternativos podem refletir uma forte restrição seletiva.
Este resultado está de acordo com os achados de Wang, E. et al., que
mostrou que exons skipping são mais conservados entre quatro genomas
de mamíferos.
HECHO POR LUCIA SENCIA 38
39. Segundo achado:
Exons alternativos são enriquecidos em ESRs quando comparado
com exons constitutivos.
HECHO POR LUCIA SENCIA 39
40. Terceiro achado:
Exons alternativos mostram maior proporção de ESRs modificados
por SNVs que exons constitutivos.
HECHO POR LUCIA SENCIA 40
41. As observações que o exons alternativos mostram uma maior densidade
de SNVS, ESRs e também uma maior proporção de ESRs modificados
pela SNVS, sugerem que esta variação genética pode até certo ponto, ser
um dos fatores causais que distingui splicing alternativo e constitutivo.
De fato vários estudos analisaram o impacto do polimorfismo de
nucleotídeo único na regulação da expressão de isoformas de maneira
tecido-específicos e não específicos e validaram alguns SNPs causais
ocorrendo em reguladores de splicing.
HECHO POR LUCIA SENCIA 41
42. Um passo a mais:
Entre o conjunto de seqüências derivadas do SNVs isoforma-associada
descobrimos que aproximadamente 86% continham pelo menos um ESR
já descritos. HECHO POR LUCIA SENCIA 42
43. ESS associados com splicing alternativo são mais modificado por
SNVs.
Estes resultados sugerem que a
influência do SNVS em alguns
tipos de splicing alternativo
ocorrem predominantemente
através de seus efeitos sobre a
ESSs.
HECHO POR LUCIA SENCIA 43
44. Analisando a polaridade das mudanças impostas pelo SNVs
podemos discriminar ainda mais o efeito do SNVS em ESSs?
Se assumirmos que o alelo derivados
aumenta a variabilidade, permitindo a
T->G T utilização de alternativos exon / intron,
podemos tentar entender melhor o efeito da
SNVs nos ESS através da definição de um
padrão de ganho ou perda ESSs com o
surgimento de um alelo derivado.
HECHO POR LUCIA SENCIA 44
45. Analisando a polaridade das mudanças impostas pelo SNVs
podemos discriminar ainda mais o efeito do SNVS em ESSs?
T->G T
HECHO POR LUCIA SENCIA 45
46. Considerações Finais.
Os resultados aqui apresentados apóiam a visão de que ESRs têm uma
maior diversidade genética nos exons alternativos quando comparado
com exons constitutivos.
Acreditamos que esta variação genética pode ser até certo ponto uma
das principais características distintivas de splicing alternativo e
constitutivo.
Além disso, fornecemos evidências que esse efeito deve-se
principalmente através SNVs agindo em ESSs.
HECHO POR LUCIA SENCIA 46