Mais conteúdo relacionado
Semelhante a [hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf (20)
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf
- 1. 426
21.1. C¸c ph−¬ng ph¸p míi ® gióp gia t¨ng tèc ®é
gi¶i tr×nh tù c¸c hÖ gen
21.2. C¸c nhµ khoa häc øng dông tin sinh häc ®Ó
ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng
21.3. C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ
mËt ®é gen
21.4. Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng
m hãa vµ nhiÒu hä ®a gen
21.5. LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù
ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa
21.6. So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng
chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn
g−êi phô n÷ trªn Hinh 21.1 vµ con tinh tinh bªn c¹nh
c« ®ang c−êi ®ïa víi nhau – cã thËt vËy kh«ng? Hä cã
hiÓu nh÷ng “c©u ®ïa giìn” vµ ®¸p l¹i b»ng vÎ mÆt cïng
víi c¸c tiÕng ph¸t ©m cña nhau kh«ng? Nhê nh÷ng kü thuËt
®−îc ph¸t triÓn gÇn ®©y trong viÖc gi¶i tr×nh tù nhanh toµn bé
c¸c hÖ gen, giê ®©y chóng ta cã thÓ tuyªn bè vÒ c¬ së di truyÒn
liªn quan ®Õn c¸c c©u hái hÊp dÉn nh− võa ®−îc nªu.
Tinh tinh (Pan troglodytes) lµ loµi cã quan hÖ sèng gÇn
chóng ta nhÊt trªn c©y tiÕn hãa cña sù sèng. HÖ gen cña nã
®−îc gi¶i tr×nh tù hoµn toµn vµo n¨m 2005, nghÜa lµ kho¶ng 2
n¨m sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi hoµn thµnh phÇn
lín. Giê ®©y chóng ta ®· cã thÓ so s¸nh hÖ gen cña chóng ta víi
hÖ gen cña tinh tinh vµ ®èi chiÕu tõng baz¬ nit¬ nh»m lµm s¸ng
tá nh÷ng th«ng tin di truyÒn kh¸c nhau nµo ®· dÉn ®Õn c¸c ®Æc
®iÓm kh¸c biÖt gi÷a hai loµi linh tr−ëng nµy.
Ngoµi viÖc ®· x¸c ®Þnh ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña
ng−êi vµ tinh tinh, c¸c nhµ nghiªn cøu còng ®· thu ®−îc tr×nh
tù hÖ gen ®Çy ®ñ cña vi khuÈn E. coli vµ nhiÒu loµi sinh vËt
nh©n s¬ kh¸c, còng nh− cña mét sè loµi sinh vËt nh©n thËt, bao
gåm Saccharomyces ceriviseae (nÊm men bia), Caenorhabitis
elegans (mét loµi giun trßn), Drosophila melanogaster (ruåi
giÊm), Mus musculus (chuét b¹ch) vµ Macaca mulatta (khØ
rhezut). ThËm chÝ c¸c ph©n ®o¹n ADN tõ c¸c loµi ®· bÞ tuyÖt
chñng, nh− gÊu hang (Ursus spelaneus) hay voi mamót l«ng
(Mammuthus primigenius) còng ®· ®−îc gi¶i tr×nh tù. C¸c tr×nh
tù hÖ gen ®Çy ®ñ hoÆc tõng phÇn b¶n th©n chóng lµ ®èi t−îng
®−îc quan t©m nghiªn cøu, ®ång thêi chóng cung cÊp nh÷ng
th«ng tin s©u h¬n vÒ tiÕn hãa vµ nhiÒu qu¸ tr×nh sinh häc kh¸c.
B»ng viÖc më réng so s¸nh hÖ gen ng−êi vµ tinh tinh víi c¸c
loµi linh tr−ëng kh¸c còng nh− víi c¸c loµi ®éng vËt cã quan hÖ
di truyÒn xa h¬n, chóng ta cã thÓ t×m thÊy tËp hîp c¸c gen quy
®Þnh sù kh¸c biÖt râ rÖt cña mçi nhãm sinh vËt. Xa h¬n mét
chót, sù so s¸nh víi c¸c hÖ gen vi khuÈn, vi khuÈn cæ (archaea),
nguyªn sinh ®éng vËt vµ c¸c loµi thùc vËt sÏ gióp chóng ta lµm
s¸ng tá lÞch sö tiÕn hãa l©u dµi liªn quan ®Õn c¸c gen ®−îc c¸c
loµi cïng nhau “chia sΔ cïng víi c¸c s¶n phÈm cña chóng.
Víi viÖc hÖ gen cña nhiÒu loµi ®· ®−îc gi¶i tr×nh tù ®Çy ®ñ,
c¸c nhµ khoa häc cã thÓ nghiªn cøu c¸c tËp hîp gen hoµn chØnh
vµ sù t−¬ng t¸c cña chóng theo mét h−íng nghiªn cøu ®−îc gäi
lµ hÖ gen häc (genomics). C¸c nç lùc gi¶i tr×nh tù theo h−íng
nghiªn cøu nµy ®· vµ ®ang tiÕp tôc t¹o ra nh÷ng khèi d÷ liÖu
khæng lå. Nhu cÇu cÇn xö lý mét l−îng th«ng tin trµn ngËp
®ang t¨ng lªn nhanh chãng ®· dÉn ®Õn sù h×nh thµnh cña lÜnh
vùc tin sinh häc (bioinformatics), lÜnh vùc øng dông c¸c
ph−¬ng ph¸p khoa häc m¸y tÝnh vµo viÖc l−u gi÷ vµ ph©n tÝch
c¸c sè liÖu sinh häc.
Chóng ta sÏ b¾t ®Çu ch−¬ng nµy b»ng viÖc th¶o luËn vÒ hai
h−íng nghiªn cøu, gåm c¸c kü thuËt gi¶i tr×nh tù hÖ gen vµ mét
sè tiÕn bé trong viÖc øng dông tin sinh häc. Sau ®ã chóng ta sÏ
s¬ l−îc vÒ nh÷ng hiÓu biÕt thu nhËn ®−îc tõ viÖc gi¶i tr×nh tù
c¸c hÖ gen ®· ®−îc tiÕn hµnh ®Õn nay. Sau ®ã chóng ta sÏ m« t¶
vÒ thµnh phÇn hÖ gen ng−êi nh− mét hÖ gen ®¹i diÖn cho c¸c
sinh vËt nh©n thËt ®a bµo. Cuèi cïng, chóng ta sÏ cïng t×m hiÓu
nh÷ng quan ®iÓm vÒ qu¸ tr×nh tiÕn hãa vµ c¸c c¬ chÕ ph¸t triÓn
vèn lµ c¬ së t¹o nªn sù ®a d¹ng vÜ ®¹i cña sù sèng hiÖn cã trªn
Tr¸i §Êt.
N
C¸c kh¸i niÖm chÝnh
Tæng quan
§äc c¸c l¸ trªn c©y sù sèng
H×nh 21.1 Th«ng tin nµo trong hÖ gen ®· t¹o nªn
con ng−êi vµ tinh tinh ?
C¸c hÖ gen
vµ sù tiÕn hãa
cña chóng
- 2. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 427
ViÖc gi¶i tr×nh tù hÖ gen ng−êi, mét dù ¸n tham väng víi tªn
gäi Dù ¸n HÖ gen Ng−êi (HGP) ®−îc b¾t ®Çu vµo n¨m 1990.
§−îc tæ chøc thµnh mét Tæ hîp (conxoocxi«m) gåm nhiÒu nhµ
khoa häc quèc tÕ ®−îc céng ®ång tµi trî, dù ¸n ®· ®−îc triÓn
khai ë 20 trung t©m gi¶i tr×nh tù lín thuéc 6 quèc gia bªn c¹nh
nhiÒu phßng thÝ nghiÖm nhá thùc hiÖn c¸c nh¸nh cña dù ¸n.
Sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®−îc hoµn thµnh
phÇn lín vµo n¨m 2003, tr×nh tù cña mçi nhiÔm s¾c thÓ ®· ®−îc
ph©n tÝch kü l−ìng vµ ®−îc m« t¶ trong hµng lo¹t c¸c bµi b¸o
khoa häc, trong ®ã bµi b¸o cuèi cïng liªn quan ®Õn tr×nh tù cña
nhiÔm s¾c thÓ sè 1 ®−îc c«ng bè vµo n¨m 2006. Víi kÕt qu¶
nµy, c¸c nhµ nghiªn cøu coi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®·
“chÝnh thøc hoµn thµnh”. §Ó ®¹t ®−îc nh÷ng cét mèc ®ã, dù ¸n
®· ®−îc triÓn khai qua ba giai ®o¹n víi c¸c ph¸t hiÖn ngµy cµng
chi tiÕt h¬n vÒ hÖ gen ng−êi; ba giai ®o¹n ®ã gåm: lËp b¶n ®å
liªn kÕt, lËp b¶n ®å vËt lý vµ gi¶i tr×nh tù ADN.
Gi¶i tr×nh tù hÖ gen qua ba giai ®o¹n
Tr−íc khi Dù ¸n HÖ gen Ng−êi b¾t ®Çu, c¸c nghiªn cøu tr−íc
®ã ®· ph¸c th¶o ®−îc mét b−íc tranh s¬ bé vÒ tæ chøc hÖ gen
cña nhiÒu c¬ thÓ sinh vËt kh¸c nhau. VÝ dô nh−, viÖc ph©n tÝch
kiÓu h×nh nhiÔm s¾c thÓ cña nhiÒu loµi ®· cho biÕt sè l−îng
nhiÔm s¾c thÓ vµ kiÓu h×nh nhuém b¨ng cña chóng (xem H×nh
13.3). Vµ ®èi víi mét sè gen, vÞ trÝ cña chóng trªn nhiÔm s¾c
thÓ ®· ®−îc x¸c ®Þnh bëi ph−¬ng ph¸p lai huúnh quang t¹i chç
(FISH), ph−¬ng ph¸p mµ trong ®ã ng−êi ta ®em lai c¸c mÉu dß
ph¸t huúnh quang víi c¸c nhiÔm s¾c thÓ nguyªn vÑn ®−îc cè
®Þnh (xem H×nh 15.1). B¶n ®å di truyÒn tÕ bµo ®−îc x©y dùng
theo c¸ch nµy ®· cung cÊp nh÷ng th«ng tin khëi ®Çu cho viÖc
lËp b¶n ®å chi tiÕt h¬n sau nµy.
Khi ®· cã trong tay b¶n ®å di truyÒn tÕ bµo cña c¸c nhiÔm
s¾c thÓ, giai ®o¹n ®Çu tiªn cña tiÕn tr×nh gi¶i tr×nh tù hÖ gen
ng−êi lµ x©y dùng mét b¶n ®å liªn kÕt (mét lo¹i b¶n ®å di
truyÒn; xem Ch−¬ng 15) cña kho¶ng vµi ngh×n dÊu chuÈn di
truyÒn ®−îc ph©n bè kh¾p c¸c nhiÔm s¾c thÓ (Hinh 21.2 giai
®o¹n ). TrËt tù vÞ trÝ cña c¸c dÊu chuÈn vµ kho¶ng c¸ch gi÷a
chóng trªn b¶n ®å ®−îc x¸c ®Þnh trªn c¬ së tÇn sè t¸i tæ hîp
(xem H×nh 15.11). C¸c dÊu chuÈn di truyÒn cã thÓ lµ c¸c gen
hoÆc lµ c¸c ®o¹n tr×nh tù ADN kh¸c cã thÓ x¸c ®Þnh ®−îc,
ch¼ng h¹n nh− c¸c RFLP hay c¸c tr×nh tù lÆp l¹i kÕ tiÕp ng¾n
(STR) ®· ®−îc ®Ò cËp ë Ch−¬ng 20. TÝnh ®Õn n¨m 1992, c¸c
nhµ nghiªn cøu ®· tËp hîp ®−îc mét b¶n ®å liªn kÕt ë ng−êi
gåm kho¶ng 5000 dÊu chuÈn kh¸c nhau. Mét b¶n ®å nh− vËy
®· gióp hä x¸c ®Þnh ®−îc vÞ trÝ cña c¸c dÊu chuÈn kh¸c, bao
gåm c¶ c¸c gen, b»ng viÖc kiÓm tra tÝnh liªn kÕt di truyÒn cña
chóng víi c¸c dÊu chuÈn ®· biÕt tr−íc ®ã. Ngoµi ra, nã cßn cã
gi¸ trÞ lµ phÇn cèt lâi cña viÖc lËp b¶n ®å chi tiÕt h¬n t¹i nh÷ng
vïng nhÊt ®Þnh trong hÖ gen.
Giai ®o¹n tiÕp theo lµ viÖc lËp b¶n ®å vËt lý hÖ gen ng−êi.
Trong b¶n ®å vËt lý, kho¶ng c¸ch gi÷a c¸c dÊu chuÈn ®−îc
biÓu diÔn bëi ®¬n vÞ vËt lý, th−êng lµ sè cÆp baz¬ nit¬ (bp) däc
theo ph©n tö ADN. §Ó lËp mét b¶n ®å hÖ gen hoµn chØnh, mét
b¶n ®å vËt lý ®−îc thiÕt lËp b»ng c¸ch c¾t ph©n tö ADN t−¬ng
øng víi mét nhiÔm s¾c thÓ thµnh mét sè c¸c ph©n ®o¹n giíi h¹n
råi x¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n trªn ph©n tö ADN nhiÔm
s¾c thÓ gèc. Ch×a khãa ®Ó thùc hiÖn ®iÒu nµy lµ cÇn t¹o ra c¸c
ph©n ®o¹n ADN gèi lªn nhau, råi sö dông c¸c mÉu dß hoÆc
ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng c¸c tr×nh tù ®Çu cuèi cña
nh÷ng ph©n ®o¹n nµy ®Ó t×m ra c¸c tr×nh tù gèi lªn nhau ®ã
(H×nh 21.2, giai ®o¹n ). B»ng c¸ch ®ã, cã thÓ ®Æt c¸c ph©n
®o¹n vµo ®óng trËt tù t−¬ng øng cña chóng trªn nhiÔm s¾c thÓ.
Nguån cung cÊp c¸c ph©n ®o¹n ADN dïng cho viÖc lËp b¶n
®å vËt lý dùa trªn viÖc nh©n dßng ADN. §Ó gi¶i tr×nh tù c¸c hÖ
gen lín, c¸c nhµ khoa häc ph¶i thùc hiÖn lÆp l¹i nhiÒu lÇn c¸c
c«ng viÖc c¾t ADN, nh©n dßng vµ lËp b¶n ®å vËt lý. C¸c vect¬
nh©n dßng ®Çu tiªn th−êng ®−îc sö dông lµ nhiÔm s¾c thÓ nh©n
t¹o nÊm men (YAC) cho phÐp mang nh÷ng ®o¹n ADN cµi dµi
®Õn hµng triÖu bp, hoÆc nhiÔm s¾c thÓ nh©n t¹o vi khuÈn (BAC)
vèn ®iÓn h×nh cã thÓ mang c¸c ®o¹n cµi dµi tõ 100.000 ®Õn
300.000 bp. Sau khi nh÷ng ®o¹n ADN dµi nh− vËy ®· ®−îc x¸c
®Þnh trËt tù trªn nhiÔm s¾c thÓ chÝnh x¸c, chóng sÏ ®−îc c¾t
thµnh nh÷ng ph©n ®o¹n nhá h¬n, råi ®−îc nh©n dßng vµo c¸c
21.1
Kh¸i niÖm
C¸c ph−¬ng ph¸p míi ® gióp
gia t¨ng tèc ®é gi¶i tr×nh tù
c¸c hÖ gen
H×nh 21.2 Ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen
qua ba giai ®o¹n. B¾t ®Çu tõ mét b¶n ®å di truyÒn tÕ bµo
cña mçi nhiÔm s¾c thÓ, c¸c nhµ nghiªn cøu liªn quan ®Õn Dù
¸n HÖ gen Ng−êi ®· tiÕn hµnh c¸c nghiªn cøu qua ba giai ®o¹n
®Ó ®¹t ®−îc môc tiªu cuèi cïng, ®ã lµ gi¶i tr×nh tù toµn bé tõng
nucleotide trªn mçi nhiÔm s¾c thÓ.
B¶n ®å di truyÒn tÕ bµo
KiÓu h×nh nhuém b¨ng cña
nhiÔm s¾c thÓ vµ vÞ trÝ c¸c gen
®Æc thï ®−îc x¸c ®Þnh b»ng
ph−¬ng ph¸p lai insitu (FISH) VÞ trÝ gen ®−îc x¸c
®Þnh b»ng FISH
C¸c b¨ng nhiÔm s¾c thÓ
sau khi ®−îc nhuém
B¶n ®å liªn kÕt
X¸c ®Þnh trËt tù cña c¸c
dÊu chuÈn di truyÒn
nh− RFLP, STR vµ c¸c
®a h×nh di truyÒn kh¸c
(kho¶ng 200 dÊu chuÈn
trªn mçi nhiÔm s¾c thÓ)
B¶n ®å vËt lý
X¸c ®Þnh trËt tù cña c¸c
ph©n ®o¹n lín gèi lªn
nhau ®−îc nh©n dßng
bëi c¸c vect¬ YAC vµ
BAC; sau ®ã lµ trËt tù
cña c¸c ®o¹n ng¾n h¬n
®−îc nh©n dßng bëi c¸c
vect¬ plasmid vµ phag¬
Gi¶i tr×nh tù ADN
X¸c ®Þnh tr×nh tù cña c¸c
nucleotide trªn mçi ®o¹n
ng¾n vµ ghÐp nèi c¸c tr×nh tù
thµnh phÇn víi nhau thµnh
tr×nh tù hÖ gen hoµn chØnh
C¸c dÊu chuÈn
di truyÒn
C¸c ®o¹n gèi
lªn nhau
- 3. 428 khèi kiÕn thøc 3 Di truyÒn häc
vect¬ plasmid hoÆc phag¬, tr−íc khi nh÷ng ph©n ®o¹n nhá nµy
®−îc dïng ®Ó gi¶i tr×nh tù chi tiÕt.
Môc tiªu cuèi cïng cña viÖc lËp b¶n ®å mét hÖ gen lµ x¸c
®Þnh ®−îc tr×nh tù nucleotide hoµn chØnh cña mçi nhiÔm s¾c thÓ
(H×nh 21.2, giai ®o¹n ). §èi víi hÖ gen ng−êi, giai ®o¹n nµy
®−îc thùc hiÖn nhê c¸c m¸y gi¶i tr×nh tù sö dông ph−¬ng ph¸p
kÕt thóc chuçi dideoxy ®−îc m« t¶ trªn H×nh 20.12. Ngay c¶
khi ®· ®−îc tù ®éng hãa, viÖc gi¶i tr×nh tù cña toµn bé 3,2 tØ cÆp
baz¬ trong bé nhiÔm s¾c thÓ ®¬n béi cña ng−êi vÉn cßn lµ mét
th¸ch thøc khñng khiÕp. Trong thùc tÕ, mét ®ét ph¸ chÝnh cña
Dù ¸n HÖ gen Ng−êi lµ sù ph¸t triÓn cña c«ng nghÖ gi¶i tr×nh tù
nhanh. Nh÷ng c¶i tiÕn kü thuËt ®−îc tÝch lòy qua nhiÒu n¨m ®·
“mµi dòa” tõng b−íc cña qui tr×nh kü thuËt vèn tèn nhiÒu thêi
gian, vµ nhê vËy tèc ®é gi¶i tr×nh tù ®· ®−îc gia tèc mét c¸ch
Ên t−îng. NÕu nh− mét phßng thÝ nghiÖm hiÖu qu¶ cã thÓ gi¶i
tr×nh tù ®−îc 1000 bp mçi ngµy vµo nh÷ng n¨m 1980, th× ®Õn
n¨m 2000, mçi trung t©m nghiªn cøu thuéc Dù ¸n HÖ gen
Ng−êi cã thÓ gi¶i tr×nh tù 1000 bp mçi gi©y trong suèt 24 giê
mçi ngµy vµ 7 ngµy mçi tuÇn. C¸c ph−¬ng ph¸p nh− vËy cã thÓ
ph©n tÝch rÊt nhanh c¸c vËt liÖu sinh häc vµ t¹o ra c¸c khèi d÷
liÖu khæng lå trong thêi gian ng¾n vµ ®−îc gäi chung lµ c¸c
ph−¬ng ph¸p “hiÖu n¨ng cao”. C¸c m¸y gi¶i tr×nh tù tù ®éng lµ
mét vÝ dô vÒ c¸c thiÕt bÞ thÝ nghiÖm hiÖu n¨ng cao.
Trong thùc tiÔn, ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2 gèi
lªn nhau theo mét c¸ch phøc t¹p h¬n m« h×nh gi¶n l−îc võa
®−îc chóng ta ®Ò cËp; tuy vËy, m« h×nh nµy ph¶n ¸nh ®óng
chiÕn l−îc nghiªn cøu tæng thÓ ®−îc dïng trong Dù ¸n HÖ gen
Ng−êi. Trong qu¸ tr×nh thùc hiÖn dù ¸n, mét chiÕn l−îc kh¸c
nh»m gi¶i tr×nh tù hÖ gen ®· xuÊt hiÖn vµ sau ®ã ®−îc ¸p dông
réng r·i nhê hiÖu qu¶ cùc kú cao cña nã. PhÇn tiÕp theo, chóng
ta ®Ò cËp ®Õn chiÕn l−îc gi¶i tr×nh tù nµy.
Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen
N¨m 1992, m¹nh d¹n dùa trªn c¸c thµnh tùu míi cña kü thuËt
gi¶i tr×nh tù vµ c«ng nghÖ m¸y tÝnh, J. Craig Venter - mét nhµ
sinh häc ph©n tö - ®· ph¸t minh ra mét ph−¬ng ph¸p gi¶i tr×nh
tù toµn hÖ gen míi. §−îc ®Æt tªn lµ ph−¬ng ph¸p gi¶i tr×nh tù
ngÉu nhiªn toµn hÖ gen (hay ph−¬ng ph¸p shotgun), thùc chÊt
ph−¬ng ph¸p nµy ®· bá qua c¸c giai ®o¹n lËp b¶n ®å liªn kÕt vµ
b¶n ®å vËt lý; thay vµo ®ã, nã b¾t ®Çu ngay b»ng viÖc gi¶i tr×nh
tù c¸c ph©n ®o¹n ADN ngÉu nhiªn cña toµn hÖ gen. Sau ®ã, c¸c
ch−¬ng tr×nh m¸y tÝnh m¹nh sÏ tiÕn hµnh s¾p xÕp mét sè l−îng
lín c¸c ph©n ®o¹n ADN ®· ®−îc gi¶i tr×nh tù, dùa trªn c¸c ®o¹n
tr×nh tù ng¾n n»m gèi lªn nhau cña chóng, thµnh mét tr×nh tù
liªn tôc duy nhÊt (Hinh 21.3).
MÆc dï ban ®Çu bÞ hoµi nghi bëi nhiÒu nhµ khoa häc, gi¸ trÞ
cña ph−¬ng ph¸p Vender trë nªn râ rµng vµo n¨m 1995 khi «ng
vµ céng sù c«ng bè hÖ gen cña mét loµi sinh vËt ®−îc gi¶i tr×nh
tù hoµn chØnh ®Çu tiªn, ®ã lµ vi khuÈn g©y bÖnh tiªu ch¶y
Haemophilus influenza. N¨m 1998, Venter thµnh lËp mét c«ng
ty cã tªn lµ Celera Genomics vµ tuyªn bè dù ®Þnh gi¶i tr×nh tù
toµn bé hÖ gen ng−êi cña m×nh. N¨m n¨m sau, Cerela
Genomics vµ Tæ hîp HGP ®ång thêi th«ng b¸o viÖc gi¶i tr×nh
tù hÖ gen ng−êi ®· hoµn thµnh phÇn lín, nghÜa lµ sím h¬n hai
n¨m so víi tiÕn ®é dù kiÕn ban ®Çu cña Dù ¸n HÖ gen Ng−êi.
C¸c ®¹i diÖn cña Tæ hîp HGP chØ ra r»ng viÖc hoµn thµnh
gi¶i tr×nh tù hÖ gen ng−êi cña Celera ph¶i dùa nhiÒu vµo c¸c
b¶n ®å di truyÒn vµ sè liÖu tr×nh tù cña hä, còng nh− c¸c trang
thiÕt bÞ mµ hä thiÕt lËp cho dù ¸n ®· hç trî nhiÒu cho c¸c nç lùc
cña Celera. Ng−îc l¹i, Venter còng ®· dïng lý lÏ ®Ó biÖn hé
cho hiÖu qu¶ vµ gi¸ thµnh h¹ trong ph−¬ng ph¸p gi¶i tr×nh tù
cña Celera, ®ång thêi chØ ra r»ng Tæ hîp HGP còng ®· sö dông
c¸c sè liÖu cña hä. Râ rµng c¶ hai ph−¬ng ph¸p ®Òu cã gi¸ trÞ vµ
cïng ®ãng gãp vµo viÖc nhanh chãng hoµn thµnh viÖc gi¶i tr×nh
tù hÖ gen cña mét sè loµi.
HiÖn nay ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen
®ang ®−îc dïng réng r·i. Theo mét c¸ch ®iÓn h×nh, c¸c ph©n
®o¹n ADN ®−îc nh©n dßng b»ng ba lo¹i vect¬ kh¸c nhau, mçi
lo¹i ®−îc cµi mét ph©n ®o¹n x¸c ®Þnh. Kho¶ng c¸ch ®· biÕt
gi÷a c¸c ®Çu cña ph©n ®o¹n ADN cµi lµ mét th«ng tin bæ sung
gióp m¸y tÝnh cã thÓ s¾p xÕp ®óng c¸c tr×nh tù. Mét nghiªn cøu
gÇn ®©y so s¸nh hai chiÕn l−îc gi¶i tr×nh tù ®· chØ ra r»ng
ph−¬ng ph¸p shotgun cã thÓ m¾c lçi bá qua mét sè tr×nh tù lÆp
l¹i, v× vËy cã thÓ ph¶n ¸nh kh«ng chÝnh x¸c kÝnh th−íc thùc cña
hÖ gen vµ cã thÓ bá qua mét sè gen trong nh÷ng vïng nh− vËy
trªn nhiÔm s¾c thÓ. C¸c ph−¬ng ph¸p phèi hîp cuèi cïng ®·
®−îc ¸p dông cho hÖ gen ng−êi; trong ®ã ph−¬ng ph¸p shotgun
cã tèc ®é nhanh ®−îc hç trî bëi b¶n ®å di truyÒn cña c¸c dßng
gen cã lÏ lµ c¸ch h÷u hiÖu nhÊt cho nh÷ng øng dông l©u dµi.
§Õn n¨m 2007, vÉn cßn mét phÇn nhá cña hÖ gen ng−êi
ch−a ®−îc gi¶i tr×nh tù. Do sù cã mÆt cña tr×nh tù ADN lÆp l¹i
vµ bëi mét sè nguyªn nh©n ch−a biÕt kh¸c, mét sè phÇn nhÊt
C¾t ADN tõ nhiÒu
b¶n sao cña mét
nhiÔm s¾c thÓ thµnh
c¸c ph©n ®o¹n gèi
lªn nhau cã chiÒu
dµi ®ñ ng¾n ®Ó cã
thÓ gi¶i tr×nh tù.
Nh©n dßng mçi ph©n
®o¹n trong c¸c vect¬
plasmid hoÆc phag¬
(xem c¸c H×nh 20.4
vµ 20.5)
Gi¶i tr×nh tù tõng
ph©n ®o¹n (xem
H×nh 20.12)
Sö dông phÇn
mÒm m¸y tÝnh
s¾p xÕp c¸c
ph©n ®o¹n theo
®óng trËt tù vÞ trÝ
cña chóng
H×nh 21.3 Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen.
Theo ph−¬ng ph¸p nµy, ®−îc ph¸t triÓn bëi Craig Venter vµ c¸c ®ång nghiÖp
t¹i C«ng ty Celera Genomics do chÝnh «ng s¸ng lËp, c¸c ®o¹n ADN ®−îc gi¶i
tr×nh tù ngÉu nhiªn, råi sau ®ã chóng ®−îc s¾p xÕp theo ®óng trËt tù vÞ trÝ
t−¬ng ®èi víi nhau. H·y so s¸nh ph−¬ng ph¸p nµy víi ph−¬ng ph¸p gi¶i tr×nh
tù toµn hÖ gen qua ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2.
C¸c ph©n ®o¹n ë giai ®o¹n 2 trªn h×nh nµy ®−îc vÏ n»m r¶i r¸c, trong
khi nh÷ng ph©n ®o¹n ë giai ®o¹n 2 trªn H×nh 21.2 ®−îc vÏ n»m theo
trËt tù vÞ trÝ. Sù kh¸c biÖt trong c¸ch vÏ nh− vËy ph¶n ¸nh sù kh¸c biÖt
gi÷a hai ph−¬ng ph¸p nh− thÕ nµo?.
- 4. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 429
®Þnh trªn nhiÔm s¾c thÓ cña c¸c c¬ thÓ ®a bµo rÊt khã gi¶i tr×nh
tù chi tiÕt bëi c¸c ph−¬ng ph¸p th«ng th−êng.
Tho¹t nh×n th× d−êng nh− tr×nh tù hÖ gen cña ng−êi vµ c¸c
sinh vËt kh¸c ®¬n gi¶n chØ lµ nh÷ng tr×nh tù “kh« khèc” cña c¸c
nucleotide, nghÜa lµ hµng triÖu c¸c “ch÷ c¸i” A, T, G vµ C s¾p
xÕp kÕ tiÕp nhau mét c¸ch “buån ch¸n”. §iÒu cèt yÕu ®Ó l−îng
d÷ liÖu khæng lå nµy trë nªn cã nghÜa lµ c¸c ph−¬ng ph¸p ph©n
tÝch mµ chóng ta sÏ ®Ò cËp ®Õn ë tiÓu môc tiÕp theo.
Mçi mét trung t©m trong sè kho¶ng 20 trung t©m gi¶i tr×nh tù
tham gia dù ¸n HÖ gen Ng−êi ngµy nµy qua ngµy kh¸c ®· t¹o ra
mét l−îng khæng lå c¸c tr×nh tù ADN. Khi sè liÖu ngµy cµng
®−îc tÝch lòy, th× nhu cÇu n¶y sinh lµ ph¶i cã c¸ch qu¶n lý vµ
theo dâi tÊt c¶ c¸c tr×nh tù ®· ®−îc ph¸t hiÖn. Nhê ®· chuÈn bÞ
tõ tr−íc, c¸c nhµ khoa häc vµ c¸c c¬ quan qu¶n lý tham gia Dù
¸n HÖ gen Ng−êi ®· ®Æt ra mét môc tiªu ngay tõ ®Çu lµ thiÕt lËp
c¸c ng©n hµng d÷ liÖu, hay cßn gäi lµ c¬ së d÷ liÖu, vµ ngµy
cµng hoµn thiÖn c¸c phÇn mÒm ph©n tÝch d÷ liÖu. Nh÷ng c¬ së
d÷ liÖu vµ nh÷ng phÇn mÒm nµy sau ®ã ®−îc tËp hîp l¹i vµ cã
thÓ dÔ dµng truy cËp vµ sö dông trªn m«i tr−êng Internet. ViÖc
hoµn thµnh môc tiªu nµy cña dù ¸n ®· gãp phÇn thóc ®Èy viÖc
ph©n tÝch c¸c tr×nh tù ADN nhê t¹o ®iÒu kiÖn cho c¸c céng
®ång khoa häc toµn thÕ giíi cã thÓ tiÕp cËn c¸c tµi nguyªn tin
sinh häc, còng nh− thóc ®Èy viÖc truyÒn b¸ vµ trao ®æi c¸c
th«ng tin cã liªn quan.
TËp hîp d÷ liÖu ®Ó ph©n tÝch c¸c hÖ gen
C¸c c¬ quan ®−îc chÝnh phñ tµi trî thùc hiÖn vai trß thiÕt lËp
c¸c c¬ së d÷ liÖu vµ cung cÊp c¸c ph©n mÒm nhê ®ã c¸c nhµ
khoa häc cã thÓ ph©n tÝch c¸c d÷ liÖu tr×nh tù hÖ gen. Ch¼ng
h¹n, ë Mü, mét ch−¬ng tr×nh hîp t¸c gi÷a Th− viÖn Y häc Quèc
gia vµ ViÖn Y häc Quèc gia (NIH) ®· thiÕt lËp nªn Trung t©m
Quèc gia vÒ Th«ng tin C«ng nghÖ Sinh häc (NCBI) ®ång thêi
duy tr× mét trang Web (www.ncbi.nlm.nih.gov) l−u gi÷ c¸c tµi
nguyªn tin sinh häc hÕt søc phong phó. T¹i trang Web nµy, c¸c
®−êng “link” dÉn ®Õn c¸c c¬ së d÷ liÖu, c¸c phÇn mÒm vµ c¸c
kho chøa c¸c th«ng tin vÒ c¸c hÖ gen vµ c¸c chñ ®Ò cã liªn quan
kh¸c. C¸c trang Web t−¬ng tù còng ®· ®−îc thiÕt lËp bëi Phßng
thÝ nghiÖm Sinh häc ph©n tö Ch©u ¢u vµ Ng©n hµng D÷ liÖu
ADN NhËt B¶n; ®©y còng chÝnh lµ hai trung t©m nghiªn cøu hÖ
gen cïng hîp t¸c víi NCBI. Nh÷ng trang Web lín vµ toµn diÖn
nµy cßn ®−îc bæ sung thªm bëi nh÷ng trang Web kh¸c ®−îc
duy tr× bëi c¸c phßng thÝ nghiÖm nhá h¬n hoÆc bëi c¸c c¸ nh©n.
C¸c trang Web nhá h¬n th−êng cung cÊp c¸c c¬ së d÷ liÖu vµ
c¸c phÇn mÒm ®−îc thiÕt kÕ cho c¸c môc ®Ých nghiªn cøu hÑp
h¬n, ch¼ng h¹n nh− ®Ó t×m hiÓu vÒ nh÷ng thay ®æi di truyÒn
hoÆc trong hÖ gen liªn quan ®Õn mét bÖnh ung th− nhÊt ®Þnh.
C¸c c¬ së d÷ liÖu vÒ c¸c tr×nh tù cña NCBI ®−îc gäi chung
lµ Ng©n hµng gen (Genbank). TÝnh tíi th¸ng 8 n¨m 2007,
Genbank ®· chøa tr×nh tù cña 76 triÖu ph©n ®o¹n ADN hÖ gen
kh¸c nhau, gåm tæng céng 80 tû cÆp baz¬ ! C¸c tr×nh tù trong
ng©n hµng gen liªn tôc ®−îc cËp nhËt, vµ −íc tÝnh l−îng d÷ liÖu
cña nã cø sau kho¶ng 18 th¸ng l¹i t¨ng lªn gÊp ®«i. Mäi tr×nh
tù trong Genbank cã thÓ ®−îc truy xuÊt vµ ph©n tÝch b»ng c¸c
ph©n mÒm ë trang Web cña NCBI hoÆc tõ c¸c trang Web kh¸c.
Mét ch−¬ng tr×nh phÇn mÒm s½n cã trªn trang Web cña
NCBI, gäi lµ BLAST, cho phÐp bÊt cø ai truy cËp cã thÓ so s¸nh
®−îc mét tr×nh tù ADN nhÊt ®Þnh víi bÊt cø tr×nh tù nµo s½n cã
trong Genbank trªn c¬ së ®èi chiÕu tõng cÆp baz¬, qua ®ã t×m
thÊy c¸c vïng tr×nh tù gièng nhau gi÷a chóng. Mét phÇn mÒm
kh¸c cho phÐp so s¸nh c¸c tr×nh tù protein dù ®o¸n. Ngoµi ra,
mét phÇn mÒm thø ba cho phÐp t×m kiÕm mét chuçi axit amin
(miÒn) cã chøc n¨ng sinh häc ®· biÕt hoÆc ®ang ®−îc dù ®o¸n
tõ mäi tr×nh tù protein s½n cã trong Genbank; ®ång thêi, nã cã
thÓ biÓu diÔn m« h×nh kh«ng gian ba chiÒu cña miÒn chøc n¨ng
®ã cïng víi c¸c th«ng tin cã liªn quan phï hîp (xem H×nh 21.4
ë trang sau). ThËm chÝ cßn cã mét ch−¬ng tr×nh phÇn mÒm cã
thÓ so s¸nh mét tËp hîp c¸c tr×nh tù, hoÆc lµ c¸c tr×nh tù axit
nucleic hoÆc lµ c¸c tr×nh tù polypeptit, vµ biÓu diÔn chóng ë
d¹ng c©y tiÕn hãa trªn c¬ së mèi quan hÖ gi÷a c¸c tr×nh tù.
(Chóng ta sÏ ®Ò cËp kü h¬n vÒ nh÷ng s¬ ®å nµy ë Ch−¬ng 26).
Trang Web cña NCBI còng cßn duy tr× mét c¬ së d÷ liÖu
bao gåm tÊt c¶ c¸c cÊu tróc ba chiÒu cña protein ®· ®−îc x¸c
®Þnh (®Ó tæng quan vÒ ph©n tÝch cÊu tróc protein, xem H×nh
5.25). B»ng phÇn mÒm m¸y tÝnh, ng−êi xem cã thÓ quay nh÷ng
cÊu tróc nµy ®Ó cã thÓ quan s¸t protein tõ mäi phÝa. Gi¶ sö mét
nhµ nghiªn cøu cã mét tr×nh tù axit amin lµ tr×nh tù ®Çy ®ñ hoÆc
mét phÇn cña mét protein ch−a biÕt nµo ®ã, mµ nã l¹i cã tr×nh
tù gièng víi mét tr×nh tù axit amin cã cÊu tróc kh«ng gian ®·
biÕt. Trong tr−êng hîp nµy, nhµ nghiªn cøu cã thÓ dù ®o¸n cÊu
tróc cña protein ch−a biÕt b»ng mét phÇn mÒm, vµ sö dông mét
phÇn mÒm kh¸c ®Ó so s¸nh nã víi tÊt c¶ c¸c cÊu tróc protein ®·
biÕt. Nh÷ng th«ng tin nµy cã thÓ gióp nhµ nghiªn cøu x¸c ®Þnh
®−îc chøc n¨ng cña protein ch−a biÕt.
HiÖn nay, trªn toµn thÕ giíi cã rÊt nhiÒu nguån tµi nguyªn
s½n cã cho c¸c nhµ nghiªn cøu sö dông. B©y giê chóng ta sÏ nãi
®Õn c¸c chñ ®Ò mµ nh÷ng nguån tµi nguyªn nµy ®Ò cËp ®Õn.
X¸c ®Þnh c¸c gen m hãa protein trong
c¸c tr×nh tù ADN
B»ng viÖc sö dông c¸c tr×nh tù ADN s½n cã, c¸c nhµ di truyÒn
häc cã thÓ nghiªn cøu trùc tiÕp c¸c gen mµ kh«ng nhÊt thiÕt
ph¶i pháng ®o¸n vÒ kiÓu gen trªn c¬ së ph©n tÝch kiÓu h×nh nh−
trong c¸c nghiªn cøu di truyÒn häc kinh ®iÓn tr−íc ®©y. Tuy
vËy, c¸ch tiÕp cËn nµy l¹i cã mét trë ng¹i kh¸c: ®ã lµ viÖc x¸c
®Þnh kiÓu h×nh trªn c¬ së kiÓu gen ®· biÕt. Trªn c¬ së mét tr×nh
21.2
Kh¸i niÖm
C¸c nhµ khoa häc øng dông tin
sinh häc ®Ó ph©n tÝch c¸c hÖ
gen vµ chøc n¨ng cña chóng
21.1
1. B¶n ®å liªn kÕt vµ b¶n ®å vËt lý cña mét nhiÔm s¾c thÓ
kh¸c nhau c¬ b¶n ë ®Æc ®iÓm g× ?
2. XÐt tæng thÓ, ph−¬ng ph¸p lËp b¶n ®å hÖ gen ®−îc dïng
trong Dù ¸n HÖ gen Ng−êi vµ ph−¬ng ph¸p gi¶i tr×nh tù
ngÉu nhiªn toµn hÖ gen kh¸c nhau nh− thÕ nµo ?
3. Gi¶ sö b¹n quyÕt ®Þnh tiÕn hµnh gi¶i
tr×nh tù hÖ gen cña mét loµi chuét ®ång, vèn lµ mét
loµi cã quan hÖ gÇn gòi víi loµi chuét thÝ nghiÖm cã
tr×nh tù hÖ gen ®· ®−îc x¸c ®Þnh hoµn toµn. T¹i sao
tr×nh tù hÖ gen chuét thÝ nghiÖm ®· biÕt ®−a b¹n ®Õn
quyÕt ®Þnh chän ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn
toµn hÖ gen thay cho ph−¬ng ph¸p ba giai ®o¹n ?
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
- 5. 430 khèi kiÕn thøc 3 Di truyÒn häc
tù ADN dµi cã trªn c¬ së d÷ liÖu nh− Genbank, b»ng c¸ch nµo
chóng ta cã thÓ nhËn ra c¸c gen m· hãa protein vèn ch−a tõng
®−îc biÕt tíi vµ x¸c ®Þnh chøc n¨ng cña chóng?
C¸ch th«ng th−êng lµ sö dông mét phÇn mÒm ®Ó t×m kiÕm
trong nh÷ng tr×nh tù nµy sù cã mÆt hay kh«ng cña c¸c tÝn hiÖu
khëi ®Çu vµ kÕt thóc phiªn m· hoÆc dÞch m·, hoÆc lµ c¸c vÞ trÝ
c¾t - nèi ARN hay c¸c tÝn hiÖu kh¸c th−êng cã ë c¸c gen m·
hãa protein. PhÇn mÒm nµy ®ång thêi còng t×m kiÕm c¸c ®o¹n
tr×nh tù ng¾n t−¬ng øng víi c¸c tr×nh tù th−êng cã trªn c¸c ph©n
tö mARN ®· biÕt. Hµng ngh×n c¸c tr×nh tù nh− vËy, ®−îc gäi lµ
c¸c ®o¹n ®¸nh dÊu tr×nh tù biÓu hiÖn hay EST ®−îc thu thËp tõ
c¸c tr×nh tù cADN vµ ®−îc m¸y tÝnh tËp hîp l¹i thµnh c¸c c¬ së
d÷ liÖu. KiÓu ph©n tÝch nµy cho phÐp x¸c ®Þnh ®−îc c¸c tr×nh tù
t−¬ng øng víi c¸c gen m· hãa protein mµ tr−íc ®ã ch−a tõng
®−îc biÕt tíi.
Kho¶ng mét nöa sè gen ë ng−êi ®· ®−îc biÕt tõ tr−íc khi dù
¸n hÖ gen ng−êi b¾t ®Çu. VËy ®èi víi nh÷ng gen cßn l¹i, viÖc
ph©n tÝch c¸c tr×nh tù ADN b»ng c¸ch nµo cho biÕt chóng lµ c¸c
gen ch−a ®−îc biÕt tr−íc ®ã? Manh mèi ®Ó x¸c ®Þnh nh÷ng gen
nµy xuÊt ph¸t tõ viÖc so s¸nh tr×nh tù cña c¸c “gen øng cö viªn”
(c¸c tr×nh tù ®−îc dù ®o¸n lµ gen) víi tr×nh tù cña c¸c gen ®·
biÕt cã nguån gèc tõ c¸c sinh vËt kh¸c b»ng viÖc sö dông c¸c
phÇn mÒm ®· ®−îc nh¾c ®Õn ë trªn. Do tÝnh tho¸i hãa cña m·
di truyÒn, b¶n th©n tr×nh tù ADN cã thÓ cã møc ®é biÕn ®æi lín
h¬n so víi c¸c tr×nh tù protein t−¬ng øng. V× vËy, víi c¸c nhµ
khoa häc quan t©m ®Õn protein, hä th−êng tiÕn hµnh so s¸nh
gi÷a tr×nh tù axit amin cña protein pháng ®o¸n víi c¸c tr×nh tù
cña c¸c protein ®· biÕt.
§«i khi mét tr×nh tù võa míi ®−îc x¸c ®Þnh khíp hoµn toµn
hay mét phÇn víi tr×nh tù cña mét gen hoÆc mét protein mµ
chøc n¨ng ®· biÕt râ. VÝ dô nh−, mét phÇn cña mét gen míi cã
thÓ khíp víi mét gen ®· biÕt m· hãa cho mét protein kinase,
mét protein quan träng tham gia vµo mét con ®−êng truyÒn tÝn
hiÖu (xem Ch−¬ng 11), chØ ra nhiÒu kh¶ n¨ng gen míi nµy cã
thÓ cã chøc n¨ng t−¬ng tù. Theo mét c¸ch kh¸c, tr×nh tù cña
mét gen míi l¹i gièng víi mét tr×nh tù ®· tõng ®−îc biÕt tõ
tr−íc nh−ng ch−a râ chøc n¨ng. Mét kh¶ n¨ng kh¸c lµ tr×nh tù
míi ®−îc x¸c ®Þnh kh«ng gièng víi bÊt cø mét tr×nh tù nµo ®·
tõng ®−îc biÕt ®Õn. §iÒu nµy lµ ®óng ®èi víi Ýt nhÊt mét phÇn
ba c¸c gen cña E. coli khi hÖ gen cña vi khuÈn nµy ®−îc gi¶i
tr×nh tù. Trong tr−êng hîp cuèi cïng, chøc n¨ng cña protein
th−êng ®−îc suy diÔn b»ng viÖc kÕt hîp gi÷a c¸c nghiªn cøu vÒ
chøc n¨ng ph©n tö vµ hãa sinh häc. C¸c nghiªn cøu vÒ hãa sinh
nh»m x¸c ®Þnh cÊu tróc kh«ng gian ba chiÒu còng nh− c¸c
thuéc tÝnh hãa lý cña protein, ch¼ng h¹n nh− c¸c vÞ trÝ liªn kÕt
cña protein víi c¸c ph©n tö kh¸c. Trong khi ®ã, c¸c nghiªn cøu
vÒ chøc n¨ng ph©n tö th−êng tiÕn hµnh lµm bÊt ho¹t hoÆc lµm
gi¶m møc ®é biÓu hiÖn cña c¸c gen míi x¸c ®Þnh råi theo dâi
H×nh 21.4 C¸c c«ng cô tin sinh
häc s½n cã trªn internet. Mét trang
web ®−îc Trung t©m Quèc gia Th«ng tin
vÒ C«ng nghÖ Sinh häc (Mü) duy tr× cho
phÐp c¸c nhµ khoa häc vµ céng ®ång tiÕp
cËn c¸c tr×nh tù protein vµ ADN. Trang
web nµy gåm c¶ kÕt nèi tíi mét c¬ së d÷
liÖu cÊu tróc protein - CDD (Conserved
Domain Database) gióp t×m vµ m« t¶
nh÷ng miÒn gièng nhau ë c¸c protein cã
quan hÖ víi nhau, còng nh− c¸c phÇn
mÒm quan s¸t ba chiÒu - Cn3D - cho phÐp
quan s¸t m« h×nh ba chiÒu cña c¸c miÒn
cÊu tróc ®· ®−îc x¸c ®Þnh. H×nh ¶nh
®−îc minh häa ë trªn lµ kÕt qu¶ t×m
kiÕm c¸c vïng protein gièng víi mét
tr×nh tù axit amin t×m thÊy ë mét protein
cña d−a hÊu.
Trong cöa sæ nµy, mét phÇn tr×nh tù axit amin tõ mét protein ch−a biÕt
(Query) ë d−a hÊu ®−îc xÕp th¼ng hµng víi c¸c tr×nh tù cña c¸c protein
kh¸c mµ ch−¬ng tr×nh m¸y tÝnh t×m thÊy gièng víi nã. C¸c tr×nh tù ë ®©y biÓu
diÔn mét miÒn ®−îc gäi lµ WD40. Bèn dÊu hiÖu ®iÓn h×nh cña miÒn nµy ®−îc
nhÊn m¹nh b»ng nÒn mµu vµng. (Sù gièng nhau gi÷a c¸c tr×nh tù ®−îc nhËn
biÕt chñ yÕu dùa trªn c¸c ®Æc ®iÓm hãa häc cña c¸c axit amin, v× vËy c¸c axit
amin ë c¸c vïng ®−îc nhÊn m¹nh kh«ng nhÊt thiÕt gièng nhau hoµn toµn.)
Ch−¬ng tr×nh Cn3D hiÓn thÞ
mét m« h×nh ruy b¨ng ba
chiÒu cña protein transductin
cña bß (protein ®−îc t« b»ng
nÒn mµu tÝm nh¹t trong cöa sæ
Sequence Aligment Viewer).
Protein nµy lµ lo¹i duy nhÊt
trong c¸c protein tr×nh diÖn ë
®©y cã cÊu tróc ®· ®−îc x¸c
®Þnh. Sù gièng víi transductin
bß cña c¸c protein kh¸c cho
thÊy cÊu tróc cña chóng cã thÓ
gièng víi m« h×nh ®−îc hiÓn
thÞ ë ®©y.
Transductin bß chøa b¶y miÒn
WD40; mét trong nh÷ng miÒn nµy
®−îc nhÊn m¹nh b»ng mµu ghi.
C¸c vïng ®−îc t« mµu vµng nµy
t−¬ng øng víi c¸c axit amin dÊu
hiÖu ®iÓn h×nh ®−îc t« mµu vµng ë
cöa sæ bªn trªn.
Cöa sæ nµy
hiÓn thÞ th«ng
tin vÒ miÒn
WD40 tõ C¬ së
d÷ liÖu cÊu tróc
protein – CDD.
- 6. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 431
sù thay ®æi cña kiÓu h×nh, qua ®ã x¸c ®Þnh chøc n¨ng cña gen.
ARNi, ®−îc m« t¶ ë Ch−¬ng 20, lµ mét vÝ dô vÒ kü thuËt phßng
thÝ nghiÖm ®−îc dïng ®Ó bÊt ho¹t chøc n¨ng cña gen.
T×m hiÓu c¸c gen vµ c¸c s¶n phÈm cña
gen ë cÊp ®é sinh häc hÖ thèng
Søc m¹nh ®Çy Ên t−îng cña c¸c c«ng cô sinh tin häc vµ m¸y
tÝnh cho phÐp c¸c nhµ khoa häc giê ®©y cã thÓ nghiªn cøu toµn
bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ vµ sù t−¬ng t¸c cña
chóng víi nhau, còng nh− cã thÓ so s¸nh hÖ gen tõ c¸c loµi
kh¸c nhau. HÖ gen häc lµ mét tµi nguyªn th«ng tin phong phó
vµ chuyªn s©u cã thÓ tr¶ lêi c¸c c©u hái c¬ b¶n vÒ c¸ch tæ chøc
cña c¸c hÖ gen, vÒ sù ®iÒu hßa sù biÓu hiÖn c¸c gen, vÒ c¸c qu¸
tr×nh sinh tr−ëng vµ ph¸t triÓn, kÓ c¶ tiÕn hãa.
Nh÷ng thµnh c«ng trong lÜnh vùc gi¶i tr×nh tù c¸c hÖ gen vµ
kh¶ n¨ng nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c
thÓ kh¸c nhau ®· thóc ®Èy c¸c nhµ khoa häc nç lùc nghiªn cøu
mét hÖ thèng t−¬ng tù c¸c bé protein ®Çy ®ñ (proteom) ®−îc
m· hãa t−¬ng øng bëi c¸c hÖ gen, tõ ®ã h×nh thµnh nªn mét
lÜnh vùc nghiªn cøu míi gäi lµ hÖ protein häc (proteomics).
C¸c protein, chø kh«ng ph¶i c¸c gen m· hãa chóng, trong thùc
tÕ thùc hiÖn phÇn lín c¸c ho¹t ®éng sèng cña tÕ bµo. V× vËy, ®Ó
t×m hiÓu sù biÓu hiÖn chøc n¨ng sinh häc cña c¸c tÕ bµo vµ c¬
thÓ, chóng ta ph¶i t×m hiÓu c¸c protein ®−îc t¹o ra khi nµo vµ ë
®©u trong mçi c¬ thÓ, còng nh− viÖc chóng t−¬ng t¸c víi nhau
thÕ nµo trong c¸c m¹ng l−íi t−¬ng t¸c ph©n tö.
C¸c hÖ thèng ®−îc t×m hiÓu thÕ nµo: mét vÝ dô
C¸c lÜnh vùc hÖ gen häc vµ hÖ protein häc cho phÐp c¸c nhµ
sinh häc tiÕn hµnh c¸c nghiªn cøu vÒ sù sèng ë qui m« ngµy
cµng réng lín vµ theo xu h−íng toµn cÇu. B»ng viÖc sö dông
c¸c c«ng cô mµ chóng ta ®· m« t¶, c¸c nhµ sinh häc ®· b¾t ®Çu
tËp hîp c¸c d÷ liÖu vÒ c¸c gen vµ c¸c protein, tøc lµ liÖt kª tÊt
c¶ c¸c “cÊu phÇn” tham gia vµo viÖc ®iÒu hµnh c¸c ho¹t ®éng
cña tÕ bµo, m« vµ c¬ thÓ. Víi tËp hîp c¸c d÷ liÖu nh− vËy, c¸c
nhµ nghiªn cøu cã thÓ chuyÓn mèi quan t©m cña hä tõ mçi cÊu
phÇn ®¬n lÎ sang sù biÓu hiÖn chøc n¨ng ë d¹ng tæ hîp gåm
nhiÒu cÊu phÇn ë c¸c cÊp ®é cña hÖ thèng sinh häc. Nhí l¹i ë
Ch−¬ng 1, chóng ta ®· ®Ò cËp ®Õn “sinh häc hÖ thèng” lµ lÜnh
vùc m« h×nh hãa c¸c biÓu hiÖn ho¹t ®éng n¨ng ®éng cña c¸c hÖ
thèng sinh häc toµn bé.
Mét øng dông c¬ b¶n cña h−íng nghiªn cøu sinh häc hÖ
thèng lµ x¸c ®Þnh ®−îc c¸c m¹ch nèi tiÕp gi÷a c¸c gen vµ c¸c
m¹ng l−íi t−¬ng t¸c cña c¸c protein. Ch¼ng h¹n nh−, ®Ó x©y
dùng ®−îc s¬ ®å m¹ng l−íi t−¬ng t¸c gi÷a c¸c protein ë ruåi
Drosophila nh− ®−îc nªu ë Ch−¬ng 1, c¸c nhµ nghiªn cøu ®·
b¾t ®Çu tõ trªn 10.000 b¶n phiªn m· ARN dù ®o¸n. Sau ®ã,
b»ng c¸c ph−¬ng ph¸p ph©n tö, hä ®· kiÓm tra sù t−¬ng t¸c gi÷a
toµn bé hoÆc mét phÇn c¸c s¶n phÈm protein thu ®−îc c¸c b¶n
phiªn m· nµy. B»ng viÖc sö dông c¸c phÐp ph©n tÝch thèng kª
®Ó chän ra c¸c mèi t−¬ng t¸c cã sè liÖu thuyÕt phôc nhÊt, hä ®·
t×m ra kho¶ng 4700 lo¹i protein biÓu hiÖn tham gia vµo 4000
mèi t−¬ng t¸c kh¸c nhau. Mét phÇn trong nh÷ng mèi t−¬ng t¸c
nµy ®−îc minh häa ë d¹ng s¬ ®å trªn H×nh 21.5; chi tiÕt cã thÓ
®−îc nh×n dÔ h¬n ë hai h×nh phãng to bªn d−íi. §Ó cã thÓ xö lý
mét sè lín c¸c d÷ liÖu thu ®−îc vÒ c¸c mèi t−¬ng t¸c protein -
protein phøc t¹p thu ®−îc tõ c¸c thÝ nghiÖm nµy, ®ång thêi cã
thÓ tæ hîp chóng víi nhau d−íi d¹ng c¸c s¬ ®å m« h×nh, chóng
ta cÇn ®Õn c¸c hÖ thèng m¸y tÝnh hiÖu n¨ng cao, c¸c c«ng cô
to¸n häc vµ c¸c phÇn mÒm ®−îc ph¸t triÓn míi. Nh− vËy, cã
thÓ nãi sinh häc hÖ thèng trong thùc tÕ ®· trë thµnh hiÖn thùc
nhê c¸c tiÕn bé cña tin sinh häc.
øng dông sinh häc hÖ thèng trong y häc
Dù ¸n Atl¸t HÖ gen Ung th− lµ mét vÝ dô kh¸c vÒ sinh häc hÖ
thèng mµ ë ®ã ng−êi ta ®ång thêi tiÕn hµnh ph©n tÝch mét sè
lín c¸c gen vµ s¶n phÈm cña gen t−¬ng t¸c víi nhau. Dù ¸n nµy
®Æt d−íi sù chØ ®¹o phèi hîp cña ViÖn Ung th− Quèc gia
(Mü)vµ NIH nh»m t×m hiÓu nh÷ng thay ®æi trong c¸c hÖ thèng
sinh häc dÉn ®Õn sù ph¸t sinh ung th−. Trong giai ®o¹n 3 n¨m
thö nghiÖm dù ¸n (tõ 2007 ®Õn 2010), c¸c nhµ nghiªn cøu tËp
trung ph©n tÝch ba lo¹i ung th− lµ ung th− phæi, ung th− buång
trøng vµ u nguyªn bµo ®Öm (glioblastoma) th«ng qua viÖc t×m
hiÓu sù kh¸c nhau trong tr×nh tù cña c¸c gen vµ sù biÓu hiÖn
cña chóng ë c¸c tÕ bµo ung th− so víi c¸c tÕ bµo b×nh th−êng.
Mét tËp hîp gåm kho¶ng 2000 gen ë c¸c tÕ bµo ung th− sÏ
®−îc gi¶i tr×nh tù vµo c¸c thêi ®iÓm kh¸c nhau trong qu¸ tr×nh
tiÕn triÓn cña bÖnh nh»m t×m ra nh÷ng thay ®æi hoÆc g©y ra do
®ét biÕn hoÆc g©y ra bëi c¸c c¬ chÕ s¾p xÕp l¹i nhiÔm s¾c thÓ
kh¸c. NÕu nh÷ng nghiªn cøu nµy thµnh c«ng, chóng sÏ ®−îc
më réng ¸p dông ®Ó nghiªn cøu c¸c lo¹i bÖnh ung th− kh¸c.
H×nh 21.5 Sinh häc hÖ thèng tiÕp cËn c¸c t−¬ng t¸c
protein. B¶n ®å t−¬ng t¸c protein tæng thÓ nµy hiÓn thÞ mét tËp
hîp con cña c¸c t−¬ng t¸c nhiÒu kh¶ n¨ng nhÊt (®−êng kÎ nèi)
tõ 2300 protein (vßng trßn nhá) ë ruåi Drosophila. Ba mµu nÒn
kh¸c nhau trªn b¶n ®å t−¬ng øng víi vÞ trÝ chung cña mçi
protein: mµu xanh lôc lµ nh©n, xanh lam lµ tÕ bµo chÊt vµ vµng
lµ mµng sinh chÊt. C¸c protein ®−îc “m· hãa” b»ng mµu t−¬ng
øng víi vÞ trÝ ®Þnh vÞ trong tÕ bµo ®Æc thï cña chóng; vÝ dô, c¸c
vßng trßn mµu xanh lôc lµ c¸c protein trong nh©n.
C¸c protein
- 7. 432 khèi kiÕn thøc 3 Di truyÒn häc
Sinh häc hÖ thèng cã tiÒm n¨ng øng dông to lín trong y häc,
mÆc dï hiÖn nay nã míi b¾t ®Çu ®−îc triÓn khai. §Õn nay,
ng−êi ta ®· t¹o ra ®−îc c¸c lo¹i chip vi d·y (microarray) lµm
b»ng thñy tinh hoÆc silicon chøa phÇn lín c¸c gen ®· biÕt cña
ng−êi (H×nh 21.6). Nh÷ng chip nh− vËy ®ang ®−îc sö dông ®Ó
ph©n tÝch sù biÓu hiÖn cña c¸c gen ë nh÷ng bÖnh nh©n m¾c c¸c
chøng bÖnh ung th− kh¸c nhau vµ mét sè bÖnh lý kh¸c n÷a.
Môc ®Ých cuèi cïng cña nh÷ng nghiªn cøu nµy lµ ®Ò ra c¸c
ph¸c ®å ®iÒu trÞ phï hîp ®Æc thï víi b¶n chÊt di truyÒn cña mçi
bÖnh nh©n vµ ®Æc tr−ng ®èi víi mçi lo¹i bÖnh ung th− mµ hä
m¾c ph¶i. C¸ch tiÕp cËn nµy ®· ®¹t ®−îc mét sè thµnh c«ng
nhÊt ®Þnh trong viÖc x¸c ®Þnh ®−îc ®Æc tÝnh ë mét sè nhãm
bÖnh ung th−.
Cuèi cïng, mçi ng−êi chóng ta cã thÓ cã mét “hå s¬ y häc”
cïng víi c¸c tr×nh tù ADN cña m×nh; ®ã lµ mét tËp hîp nhá
th«ng tin di truyÒn víi c¸c vïng hÖ gen ®−îc “®¸nh dÊu” cho
biÕt xu h−íng mÉn c¶m víi nh÷ng bÖnh nhÊt ®Þnh. Lóc nµy,
tiÒm n¨ng øng dông trong phßng tr¸nh vµ ®iÒu trÞ bÖnh ®èi víi
mçi ng−êi sÏ thµnh hiÖn thùc.
Sinh häc hÖ thèng lµ mét c¸ch tiÕp cËn nghiªn cøu hiÖu qu¶
vÒ c¸c thuéc tÝnh ë cÊp ®é ph©n tö. Tõ Ch−¬ng 1 chóng ta nhí
l¹i r»ng, c¸c thuéc tÝnh míi ®−îc t×m thÊy ë cÊp ®é tæ chøc
phøc t¹p h¬n th−êng b¾t nguån tõ sù s¾p xÕp c¸c “khèi cÊu
tróc” cña cÊp ®é tæ chøc thÊp h¬n. Khi chóng ta hiÓu biÕt ngµy
cµng ®Çy ®ñ h¬n vÒ c¸ch s¾p xÕp vµ tæ hîp cña c¸c cÊu phÇn
thuéc c¸c hÖ thèng di truyÒn, chóng ta cµng hiÓu biÕt s©u h¬n
vÒ ho¹t ®éng cña c¸c c¬ thÓ sèng. PhÇn cßn l¹i cña ch−¬ng nµy
sÏ ®Ò cËp ®Õn nh÷ng kiÕn thøc mµ chóng ta ®· häc ®−îc ®Õn
nµy nhê c¸c nghiªn cøu thuéc lÜnh vùc hÖ gen häc.
TÝnh ®Õn ®Çu n¨m 2008, viÖc gi¶i tr×nh tù cña trªn 700 hÖ gen
®· hoµn thµnh vµ kho¶ng trªn 2700 hÖ gen kh¸c ®ang tiÕp tôc
®−îc gi¶i tr×nh tù. Trong nhãm c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù
hoµn toµn, cã kho¶ng 600 hÖ gen vi khuÈn vµ 50 hÖ gen vi
khuÈn cæ. Trong sè 65 loµi sinh vËt nh©n thËt thuéc nhãm nµy
cã c¸c loµi ®éng vËt cã x−¬ng sèng, c¸c loµi ®éng vËt kh«ng
x−¬ng sèng, c¸c nguyªn sinh ®éng vËt, nÊm vµ thùc vËt. C¸c
tr×nh tù hÖ gen ®· ®−îc tÝch lòy chøa ®ùng mét tµi nguyªn
th«ng tin phong phó mµ hiÖn nay chóng ta míi b¾t ®Çu khai
th¸c. Cho ®Õn nay chóng ta ®· häc ®−îc g× tõ viÖc so s¸nh c¸c
hÖ gen ®· ®−îc gi¶i tr×nh tù? Trong môc nµy, chóng ta sÏ xem
xÐt c¸c ®Æc tÝnh vÒ kÝch cì hÖ gen, sè gen vµ mËt ®é gen cña
chóng. Do xÐt vÒ chi tiÕt, c¸c ®Æc tÝnh nµy rÊt ®a d¹ng, nªn
chóng ta chØ nhÊn m¹nh vµo c¸c xu h−íng chung; tuy vËy, bªn
c¹nh c¸c xu h−íng chung th× th−êng xuÊt hiÖn c¸c ngo¹i lÖ.
KÝch cì hÖ gen
Khi so s¸nh hÖ gen gi÷a ba liªn giíi (vi khuÈn, vi khuÈn cæ vµ
sinh vËt nh©n thËt), chóng ta nhËn thÊy mét xu h−íng kh¸c biÖt
chung vÒ kÝch cì hÖ gen gi÷a c¸c sinh vËt nh©n s¬ (vi khuÈn vµ
vi khuÈn cæ) víi sinh vËt nh©n thËt (B¶ng 21.1). Ngoµi mét sè
ngo¹i lÖ, phÇn lín hÖ gen vi khuÈn cã kÝch cì tõ 1 ®Õn 6 triÖu
cÆp baz¬ (bp); ch¼ng h¹n nh− hÖ gen cña E. coli lµ 4,6 triÖu bp.
HÖ gen cña c¸c vi khuÈn cæ trong phÇn lín tr−êng hîp cã kÝch
cì gièng víi hÖ gen vi khuÈn. (Tuy vËy, cÇn ph¶i nhí r»ng míi
chØ cã mét sè Ýt hÖ gen vi khuÈn cæ ®· ®−îc gi¶i tr×nh tù hoµn
toµn, v× vËy “bøc tranh toµn c¶nh” nµy còng cã thÓ sÏ thay ®æi.)
C¸c hÖ gen sinh vËt nh©n thËt cã xu h−íng lín h¬n. HÖ gen cña
nÊm men ®¬n bµo Saccharomyces cerevisiae lµ kho¶ng 13 Mb
(triÖu cÆp baz¬); trong khi ®ã, phÇn lín c¸c loµi ®éng vËt vµ
thùc vËt, tøc lµ c¸c sinh vËt ®a bµo, cã kÝch cì hÖ gen Ýt nhÊt lµ
100 Mb. HÖ gen ruåi giÊm cã kÝch cì lµ 180 Mb, cßn hÖ gen
ng−êi lµ 3.200 Mb, nghÜa lµ lín h¬n tõ 500 ®Õn 3000 lÇn so víi
mét hÖ gen vi khuÈn ®iÓn h×nh.
Bªn c¹nh sù kh¸c biÖt chung gi÷a hÖ gen cña c¸c sinh vËt
nh©n s¬ vµ sinh vËt nh©n thËt, th× viÖc so s¸nh kÝch cì hÖ gen
trong ph¹m vi c¸c loµi sinh vËt nh©n thËt l¹i kh«ng ph¶n ¸nh
mèi t−¬ng quan cã hÖ thèng gi÷a kÝch cì hÖ gen víi kiÓu h×nh
cña c¸c loµi sinh vËt. Ch¼ng h¹n nh−, hÖ gen cña loµi Fritillaria
assyriaca, mét loµi hoa thuéc hä lily, cã kÝch cì lµ 120 tØ cÆp
baz¬ (120.000 Mb), tøc lµ lín h¬n kho¶ng 40 lÇn so víi hÖ gen
ng−êi. Nh−ng cßn kinh ng¹c h¬n lµ hÖ gen mét loµi amip ®¬n
bµo, Amoeba dubia, cã kÝch cì kho¶ng 670.000 Mb. (HÖ gen
loµi nµy ch−a ®−îc gi¶i tr×nh tù.) Trong ph¹m vi hÑp h¬n, viÖc
so s¸nh hÖ gen gi÷a hai loµi c«n trïng cho thÊy hÖ gen cña dÕ
(Anabrus simplex) lín h¬n 11 lÇn so víi hÖ gen cña ruåi giÊm
(Drosophila melanogaster). KÝch cì hÖ gen còng biÕn ®éng
réng trong ph¹m vi mçi nhãm loµi nguyªn sinh ®éng vËt, c«n
trïng, l−ìng c− vµ thùc vËt; nh−ng Ýt biÕn ®éng h¬n trong ph¹m
vi c¸c loµi thó vµ bß s¸t.
Sè gen
Mét xu h−íng kh¸c biÖt t−¬ng tù còng ®óng khi xÐt vÒ sè gen:
nghÜa lµ, nh×n chung c¸c vi khuÈn vµ vi khuÈn cæ cã Ýt gen h¬n
so víi sinh vËt nh©n thËt. C¸c vi khuÈn vµ vi khuÈn cæ sèng tù
21.3
Kh¸i niÖm
C¸c hÖ gen kh¸c nhau vÒ kÝch
cì, sè gen vµ mËt ®é gen
H×nh 21.6 Mét chip
ph©n tÝch gen ng−êi. C¸c
®iÓm nhá chøa ADN ®−îc xÕp thµnh
c¸c ®−êng kÎ « trªn b¶n silicon nµy
®¹i diÖn cho hÇu hÕt c¸c gen trong hÖ
gen ng−êi. Nhê sö dông chip nµy, c¸c
nhµ nghiªn cøu cã thÓ ph©n tÝch cïng
lóc møc biÓu hiÖn cña tÊt c¶ c¸c gen,
qua ®ã gióp gi¶m l−îng hãa chÊt cÇn
dïng tèi ®a ®ång thêi ®¶m b¶o ®iÒu
kiÖn ®ång ®Òu cho tÊt c¶ c¸c gen.
21.2
1. Internet cã vai trß nh− thÕ nµo trong c¸c nghiªn cøu hiÖn
nay vÒ c¸c hÖ gen häc vµ protein häc ?
2. H·y gi¶i thÝch −u thÕ cña c¸c nghiªn cøu theo h−íng sinh
häc hÖ thèng khi t×m hiÓu vÒ ung th− so víi ph−¬ng ph¸p
nghiªn cøu ®éc lËp tõng gen vµo mçi thêi ®iÓm.
3. Gi¶ sö b¹n ®ang dïng mét ph−¬ng
ph¸p nghiªn cøu di truyÒn kinh ®iÓn ®Ó t×m hiÓu mét
tÝnh tr¹ng di truyÒn ë ruåi Drosophila. Cô thÓ, b¹n ®·
g©y ®ét biÕn ë ruåi vµ chän läc ra ®−îc c¸c c¸ thÓ cã
kiÓu h×nh mµ b¹n quan t©m. Gi¶ thiÕt b¹n còng cã thÓ
sö dông c¸c c«ng cô sinh häc ph©n tö ®Ó thu ®−îc vïng
ADN mang ®ét biÕn. B¹n sÏ tiÕp tôc ph©n tÝch ®ét biÕn
®ã nh− thÕ nµo ®Ó cã thÓ x¸c ®Þnh ®−îc c¸ch mµ nã
liªn quan ®Õn kiÓu h×nh ®−îc quan t©m ?
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
- 8. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 433
do cã tõ 1500 ®Õn 7500 gen, trong khi sè gen ë c¸c sinh vËt
nh©n thËt dao ®éng tõ kho¶ng 5000 gen ë c¸c nÊm ®¬n bµo cho
®Õn Ýt nhÊt 40.000 gen ë mét sè loµi sinh vËt nh©n thËt ®a bµo
(xem B¶ng 21.1).
Trong ph¹m vi c¸c loµi sinh vËt nh©n thËt, sè gen ë mçi loµi
th−êng thÊp h¬n sè gen ®−îc dù ®o¸n ®¬n thuÇn trªn c¬ së kÝch
cì hÖ gen cña chóng. Nh×n vµo B¶ng 21.1, b¹n cã thÓ thÊy hÖ
gen giun trßn C. elegans cã kÝch cì lµ 100 Mb vµ chøa kho¶ng
20.000 gen. Trong khi ®ã, hÖ gen Drosophila cã kÝch c¬ gÇn
gÊp ®«i (180 Mb), song chØ cã sè gen b»ng kho¶ng hai phÇn ba
- tøc lµ, chØ cã 13.700 gen.
H·y xem mét vÝ dô kh¸c gÇn gòi h¬n, chóng ta ®Ó ý thÊy hÖ
gen ng−êi chøa 3200 Mb, tøc lµ lín h¬n kho¶ng trªn 10 lÇn so
víi c¸c hÖ gen Drosophila vµ C. elegans. Khi Dù ¸n HÖ gen
Ng−êi khëi ®éng, trªn c¬ së sè protein ®· biÕt, c¸c nhµ sinh häc
mong ®îi sÏ cã kho¶ng tõ 50.000 ®Õn 100.000 gen sÏ ®−îc x¸c
®Þnh sau khi hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen. Däc theo tiÕn
tr×nh triÓn khai dù ¸n, sè gen −íc l−îng cã trong hÖ gen ng−êi
®−îc söa ®æi nhiÒu lÇn theo xu h−íng gi¶m dÇn; vµ ®Õn n¨m
2007, sè gen −íc l−îng ®−îc tin cËy h¬n c¶ dõng ë con sè
20.488 gen. Sè l−îng gen t−¬ng ®èi thÊp nµy, chØ gÇn gièng sè
gen cã ë loµi giun trßn C. elegans, ®· g©y söng sèt nhiÒu nhµ
sinh häc vèn ®· lu«n mong ®îi hÖ gen ng−êi cã nhiÒu gen h¬n.
Thuéc tÝnh di truyÒn nµo ®· cho phÐp loµi ng−êi (vµ nhiÒu
loµi ®éng vËt cã x−¬ng sèng kh¸c) tiÕn hãa mµ kh«ng cÇn
nhiÒu gen h¬n so víi giun trßn? Mét yÕu tè quan träng ®ã lµ
c¸c tr×nh tù m· hãa trong c¸c hÖ gen ®éng vËt cã x−¬ng sèng cã
®Æc ®iÓm “mét vèn bèn lêi” do chóng cã nhiÒu c¸ch c¾t - nèi
c¸c b¶n phiªn m· kh¸c nhau. Chóng ta nhí l¹i r»ng qu¸ tr×nh
nµy cã thÓ t¹o ra nhiÒu h¬n mét lo¹i protein biÓu hiÖn chøc
n¨ng xuÊt ph¸t tõ mét gen duy nhÊt (xem H×nh 18.11). VÝ dô
nh−, hÇu hÕt c¸c gen ë ng−êi ®Òu chøa nhiÒu exon, vµ −íc
l−îng cã kho¶ng 75% sè gen gåm nhiÒu exon nµy ®−îc c¾t -
nèi Ýt nhÊt b»ng hai c¸ch kh¸c nhau. NÕu chóng ta gi¶ thiÕt mçi
gen khi ®−îc c¾t nèi theo c¸c c¸ch kh¸c nhau trung b×nh x¸c
®Þnh 3 chuçi polypeptit kh¸c nhau, th× tæng sè chuçi polypeptit
kh¸c nhau ë ng−êi sÏ ®¹t con sè kho¶ng 75.000. Sù ®a d¹ng cña
c¸c chuçi polypeptit thùc tÕ cßn bæ sung thªm bëi c¸c biÕn ®æi
sau dÞch m·, ch¼ng h¹n bëi sù c¾t tØa c¸c axit amin hay g¾n
thªm c¸c gèc cacbohydrat diÔn ra kh¸c nhau ë c¸c tÕ bµo kh¸c
nhau hoÆc ë c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn.
MËt ®é gen vµ c¸c tr×nh tù ADN kh«ng
m· hãa
Bªn c¹nh kÝch cì hÖ gen vµ sè gen, chóng ta còng cã thÓ so
s¸nh mËt ®é gen ë nh÷ng loµi kh¸c nhau, nghÜa lµ cã bao nhiªu
gen trªn mét ®¬n vÞ chiÒu dµi cña ADN. Khi chóng ta so s¸nh
hÖ gen gi÷a c¸c loµi vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt,
chóng ta thÊy sinh vËt nh©n thËt th−êng cã hÖ gen lín h¬n
nh−ng l¹i cã sè gen Ýt h¬n trªn cïng mét sè nhÊt ®Þnh c¸c cÆp
baz¬. Ng−êi cã kÝch cì hÖ gen lín h¬n hµng tr¨m thËm chÝ
hµng ngh×n lÇn so víi hÖ gen cña phÇn lín c¸c loµi vi khuÈn,
nh−ng nh− chóng ta ®· nãi, ng−êi chØ cã sè gen gÊp tõ 5 ®Õn 15
lÇn so víi nh÷ng loµi nµy; nh− vËy, mËt ®é gen ë ng−êi lµ thÊp
h¬n (xem B¶ng 21.1). Ngay c¶ c¸c loµi sinh vËt nh©n thËt ®¬n
bµo, nh− nÊm men, còng cã Ýt gen h¬n trong mçi mét triÖu cÆp
baz¬ so víi c¸c loµi vi khuÈn vµ vi khuÈn cæ. Trong sè c¸c hÖ
gen ®· ®−îc gi¶i tr×nh tù hoµn toµn ®Õn nay, ng−êi vµ c¸c loµi
thó cã mËt ®é gen thÊp nhÊt.
Trong tÊt c¶ c¸c hÖ gen vi khuÈn ®·
®−îc nghiªn cøu ®Õn nay, phÇn lín ADN
chøa c¸c gen m· hãa cho protein, tARN
hoÆc rARN; mét l−îng nhá cña c¸c tr×nh
tù ADN cßn l¹i gåm chñ yÕu lµ c¸c tr×nh
tù ®iÒu hßa kh«ng ®−îc phiªn m·, ch¼ng
h¹n nh− c¸c tr×nh tù khëi ®Çu phiªn m·
(promoter). Tr×nh tù c¸c nucleotit däc theo
mét gen m· hãa protein ë vi khuÈn th−êng
kh«ng bÞ ng¾t qu·ng tõ vÞ trÝ b¾t ®Çu cho
®Õn vÞ trÝ kÕt thóc bëi c¸c tr×nh tù kh«ng
m· hãa (intron). Ng−îc l¹i, ë c¸c hÖ gen
sinh vËt nh©n thËt, phÇn lín ADN hoÆc
kh«ng ®−îc dïng ®Ó m· hãa cho protein
hoÆc kh«ng ®−îc phiªn m· thµnh c¸c ph©n
tö ARN biÓu hiÖn chøc n¨ng (nh− tARN
ch¼ng h¹n), ®ång thêi ADN chøa nhiÒu
tr×nh tù ®iÒu hßa phøc t¹p. Trong thùc tÕ,
hÖ gen ng−êi chøa ADN kh«ng m· hãa
nhiÒu h¬n kho¶ng 10.000 lÇn so víi hÖ
gen vi khuÈn. Mét sè tr×nh tù ADN kh«ng
m· hãa nµy ë sinh vËt nh©n thËt ®a bµo
xuÊt hiÖn trong c¸c intron cña c¸c gen.
Thùc tiÔn cho thÊy c¸c intron lµ nh©n tè
chÝnh dÉn ®Õn phÇn lín c¸c kh¸c biÖt vÒ
chiÒu dµi trung b×nh gi÷a c¸c gen cña
ng−êi (27.000 bp) so víi c¸c gen cña vi
khuÈn (1000 bp).
B¶ng 21.1 KÝch cì hÖ gen vµ sè gen −íc tÝnh*
Loµi
KÝch cì hÖ
gen ®¬n
béi (Mb)
Sè
gen
Sè gen /
Mb
Vi khuÈn
Haemophilus influenzae 1,8 1700 940
Escherichia coli 4,6 4400 950
Vi khuÈn cæ
Archaeoglobus fulgidus 2,2 2500 1130
Methanosarcina barkeri 4,8 3600 750
Sinh vËt nh©n thËt
Saccharomyces cerevisiae (nÊm men) 13 6200 480
Caenorhabditis elegans (giun trßn) 100 20.000 200
Arabidopsis thaliana (c©y thuéc hä mï t¹t) 118 25.500 215
Drosophila melanogaster (ruåi giÊm) 180 13.700 76
Oryza sativa (lóa g¹o) 390 40.000 140
Danio rerio (c¸ ngùa) 1700 23.000 13
Mus musculus (chuét nhµ) 2600 22.000 11
Homo sapiens (ng−êi) 3200 20.500 7
Fritillaria assyriaca (c©y thuéc hä lily) 120.000 ND ND
* Mét sè sè liÖu trªn ®©y cã thÓ sÏ ®−îc chØnh lý sau nµy do c¸c ph©n tÝch hÖ gen vÉn ®ang tiÕp tôc tiÕn hµnh. Mb = 1 triÖu
cÆp baz¬ (bp). ND = ch−a x¸c ®Þnh.
- 9. 434 khèi kiÕn thøc 3 Di truyÒn häc
Bªn c¹nh c¸c intron, c¸c sinh vËt nh©n thËt ®a bµo chøa mét
l−îng lín ADN kh«ng m· hãa ë gi÷a c¸c gen. Trong môc tiÕp
theo, chóng ta sÏ m« t¶ thµnh phÇn vµ c¸ch s¾p xÕp c¸c chuçi
tr×nh tù lín cña ADN nh− vËy trong hÖ gen ng−êi.
§Õn ®©y, cã thÓ nãi chóng ta ®· dïng phÇn lín dung l−îng cña
ch−¬ng nµy, mµ thùc tÕ lµ cña c¶ khèi kiÕn thøc nµy, ®Ó tËp
trung nãi vÒ c¸c gen m· hãa protein. Nh−ng trong thùc tÕ, c¸c
vïng m· hãa cña nh÷ng gen nµy vµ c¸c gen m· hãa cho c¸c s¶n
phÈm ARN nh− rARN, tARN vµ tiÓu-ARN (miARN hay
microARN) chØ chiÕm mét tØ lÖ nhá trong hÖ gen cña phÇn lín
c¸c sinh vËt nh©n thËt ®a bµo. Mét phÇn lín hÖ gen cña hÇu hÕt
sinh vËt nh©n thËt lµ c¸c tr×nh tù ADN hoÆc kh«ng m· hãa cho
protein hoÆc kh«ng ®−îc phiªn m· ®Ó t¹o nªn c¸c lo¹i ARN cã
chøc n¨ng ®· biÕt; nh÷ng tr×nh tù ADN kh«ng m· hãa nµy
tr−íc kia th−êng ®−îc m« t¶ nh− c¸c “ADN d− thõa”. Tuy vËy,
ngµy cµng cã nhiÒu b»ng chøng cho thÊy nh÷ng tr×nh tù ADN
nµy gi÷ vai trß quan träng trong ho¹t ®éng sèng cña tÕ bµo; ý
t−ëng nµy ®ång thêi ®−îc cñng cè bëi sù tån t¹i mét c¸ch “bÒn
v÷ng” qua hµng tr¨m thÕ hÖ cña nh÷ng tr×nh tù nµy ë nhiÒu hÖ
gen kh¸c nhau. Ch¼ng h¹n, khi so s¸nh hÖ gen gi÷a ng−êi víi
chuét ®ång vµ chuét nhµ, c¸c nhµ nghiªn cøu t×m thÊy cã ®Õn
500 vïng ADN kh«ng m· hãa trong hÖ gen gièng hÖt nhau ë c¶
ba loµi. ë nh÷ng loµi nµy, møc ®é b¶o thñ cña nh÷ng tr×nh tù
nµy thËm chÝ cßn cao h¬n so víi c¸c vïng m· hãa protein; ®iÒu
nµy ñng hé m¹nh mÏ cho gi¶ thiÕt c¸c vïng kh«ng m· hãa cã
nh÷ng chøc n¨ng quan träng. Trong môc nµy chóng ta sÏ t×m
hiÓu c¸c gen vµ c¸c tr×nh tù ADN kh«ng m· hãa ®−îc tæ chøc
nh− thÕ nµo trong hÖ gen cña c¸c sinh vËt nh©n thËt, víi vÝ dô
chñ yÕu chÝnh lµ hÖ gen ng−êi cña chóng ta. C¸ch tæ chøc cña
hÖ gen cho chóng ta biÕt con ®−êng mµ c¸c hÖ gen ®· vµ ®ang
tiÕp tôc tiÕn hãa; ®©y còng lµ néi dung ®−îc ®Ò cËp tiÕp theo.
Khi hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn toµn, mét sù
thËt ®−îc béc lé râ rµng lµ chØ cã 1,5% tr×nh tù nucleotit trong
hÖ gen ®−îc dïng hoÆc ®Ó m· hãa cho c¸c protein hoÆc ®−îc
phiªn m· thµnh c¸c ph©n tö rARN vµ tARN. H×nh 21.7 cho thÊy
thµnh phÇn cÊu tróc nªn 98,5% tr×nh tù cßn l¹i cña hÖ gen
ng−êi. C¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen vµ c¸c tr×nh
tù intron chiÕm 24% hÖ gen ng−êi; phÇn cßn l¹i, n»m gi÷a c¸c
gen biÓu hiÖn chøc n¨ng (c¸c tr×nh tù liªn gen), gåm c¸c tr×nh
tù kh«ng m· hãa ®¬n nhÊt, ch¼ng h¹n nh− c¸c ph©n ®o¹n cña
gen vµ c¸c gen gi¶, tøc lµ c¸c gen cò vèn tõng tån t¹i nh−ng
sau ®ã do tÝch lòy c¸c ®ét biÕn ®· trë nªn mÊt chøc n¨ng. Tuy
vËy, phÇn lín c¸c tr×nh tù ADN liªn gen lµ nh÷ng tr×nh tù
ADN lÆp l¹i, tøc lµ c¸c tr×nh tù cã mÆt víi nhiÒu b¶n sao trong
hÖ gen. §iÒu ®¸ng ng¹c nhiªn lµ ba phÇn t− cña c¸c tr×nh tù
ADN lÆp l¹i nµy (t−¬ng øng víi 44% cña toµn bé hÖ gen ng−êi)
t¹o nªn c¸c ®¬n vÞ ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng
hoÆc c¸c tr×nh tù cã liªn quan ®Õn chóng.
21.4
Kh¸i niÖm
Sinh vËt nh©n thËt ®a bµo cã
nhiÒu ADN kh«ng m hãa vµ
nhiÒu hä ®a gen
21.3
1. Theo c¸c sè liÖu −íc tÝnh hiÖn nay, hÖ gen ng−êi chøa
kho¶ng 20.500 gen. Tuy vËy, cã b»ng chøng cho thÊy c¸c
tÕ bµo ng−êi cã thÓ s¶n sinh nhiÒu h¬n 20.500 lo¹i chuçi
polypeptide kh¸c nhau. Nh÷ng qu¸ tr×nh nµo cã thÓ gióp
gi¶i thÝch cho sù “kh«ng nhÊt qu¸n” nµy?
2. Sè hÖ gen ®−îc gi¶i tr×nh tù ®ang tiÕp tôc t¨ng lªn ®Òu
®Æn. H·y sö dông trang web www.genomesonline.org ®Ó
t×m sè hÖ gen hiÖn t¹i thuéc c¸c liªn giíi kh¸c nhau ®·
®−îc gi¶i tr×nh tù hoµn toµn, còng nh− sè hÖ gen ®ang tiÕp
tôc ®−îc gi¶i tr×nh tù (gîi ý: H·y dïng chuét nh¸y kÐp
vµo khÈu lÖnh “GOLD tables” råi sau ®ã nh¸y kÐp vµo
“Published Complete Genomes” ®Ó cã thªm th«ng tin.)
3. C¸c qu¸ tr×nh tiÕn hãa nµo cã thÓ gi¶i
thÝch cho viÖc c¸c sinh vËt nh©n s¬ cã hÖ gen nhá h¬n
so víi c¸c sinh vËt nh©n thËt ?
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
H×nh 21.7 C¸c lo¹i tr×nh tù ADN trong hÖ gen ng−êi.
C¸c tr×nh tù gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö
rARN hay tARN chØ chiÕm kho¶ng 1,5% hÖ gen ng−êi (mµu tÝa sÉm trªn biÓu
®å táa trßn), trong khi c¸c tr×nh tù ®iÒu hßa vµ c¸c intron liªn quan ®Õn c¸c
gen (mµu tÝa nh¹t) chiÕm kho¶ng 1/4 hÖ gen. PhÇn lín h¬n c¶ cña hÖ gen
ng−êi lµ nh÷ng tr×nh tù kh«ng m· hãa cho protein vµ còng kh«ng ®−îc dïng
®Ó t¹o ra c¸c lo¹i ARN ®· biÕt, mµ phÇn nhiÒu trong nh÷ng tr×nh tù nµy lµ c¸c
ADN lÆp l¹i (mµu xanh lôc sÉm vµ nh¹t). Do ADN lÆp l¹i lµ nh÷ng tr×nh tù khã
ph©n tÝch vµ khã gi¶i tr×nh tù h¬n c¶, nªn sù ph©n lo¹i cña mét phÇn nh÷ng
tr×nh tù nµy ë trªn chØ cã tÝnh −íc ®o¸n, vµ c¸c tØ lÖ phÇn tr¨m ®−îc nªu cã thÓ
sÏ thay ®æi ®«i chót khi c¸c nghiªn cøu ph©n tÝch hÖ gen vÉn ®ang tiÕp diÔn.
Nh÷ng gen m· hãa c¸c miARN míi ®−îc t×m thÊy gÇn ®©y thuéc c¸c vïng
ADN kh«ng m· hãa ®¬n nhÊt (tøc lµ kh«ng lÆp l¹i) vµ trong c¸c intron; nghÜa
lµ, chóng thuéc hai vïng cña ®å thÞ táa trßn trªn ®©y.
C¸c exon (c¸c vïng gen m· hãa cho protein hoÆc
®−îc phiªn m· thµnh rARN vµ tARN) (1,5%)
Intron vµ c¸c tr×nh tù
®iÒu hßa liªn quan
®Õn c¸c gen (24%)
C¸c tr×nh tù ADN
kh«ng m· hãa
®¬n nhÊt (15%)
ADN lÆp l¹i
kh«ng liªn quan
®Õn c¸c yÕu tè
vËn ®éng (15%)
ADN lÆp l¹i
bao gåm c¸c
yÕu tè vËn
®éng vµ c¸c
tr×nh tù liªn
quan ®Õn
chóng (44%)
C¸c ®o¹n lÆp kÝch th−íc lín (5 - 6%)
ADN tr×nh tù
®¬n gi¶n (3%)
C¸c yÕu tè
Alu (3%)
C¸c tr×nh tù
L1 (17%)
- 10. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 435
C¸c yÕu tè di truyÒn vËn ®éng vµ c¸c
tr×nh tù cã liªn quan ®Õn chóng
C¶ sinh vËt nh©n s¬ còng nh− sinh vËt nh©n thËt ®Òu cã trong hÖ
gen nh÷ng ®o¹n tr×nh tù ADN cã thÓ di chuyÓn tõ vÞ trÝ nµy
sang vÞ trÝ kh¸c trong hÖ gen. Nh÷ng ®o¹n tr×nh tù ADN nh−
vËy ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng, hay ®−îc gäi t¾t
lµ c¸c yÕu tè vËn ®éng. Trong qu¸ tr×nh ®−îc gäi lµ vËn ®éng,
mét yÕu tè vËn ®éng sÏ di chuyÓn tõ mét vÞ trÝ trªn ADN trong
tÕ bµo tíi mét vÞ trÝ ®Ých kh¸c nhê mét qu¸ tr×nh t¸i tæ hîp. §«i
khi c¸c yÕu tè vËn ®éng ®−îc gäi lµ c¸c “gen nh¶y”, nh−ng
thuËt ng÷ nµy thùc tÕ dÔ g©y hiÓu nhÇm bëi trong thùc tÕ nh÷ng
®o¹n tr×nh tù ADN vËn ®éng kh«ng bao giê rêi khái ADN cña
tÕ bµo. (C¸c vÞ trÝ gèc vµ vÞ trÝ ®Ých míi cña c¸c yÕu tè vËn
®éng ®−îc ®−a ®Õn gÇn nhau bëi c¬ chÕ “bÎ cong” ADN.)
B»ng chøng ®Çu tiªn vÒ c¸c ph©n ®o¹n ADN cã thÓ di
chuyÓn ®−îc ph¸t hiÖn tõ c¸c thÝ nghiÖm lai gièng ë c©y ng«
®−îc nhµ n÷ di truyÒn häc ng−êi Mü lµ Barbara McClintock
tiÕn hµnh vµo nh÷ng n¨m 1940 vµ 1950 (H×nh 21.8). Khi theo
dâi c¸c c©y ng« qua nhiÒu thÕ hÖ, McClintock x¸c ®Þnh ®−îc sù
thay ®æi mµu néi nhò cña c¸c h¹t ng« chØ cã thÓ gi¶i thÝch ®−îc
nÕu nh− cã sù tån t¹i cña c¸c yÕu tè di truyÒn cã thÓ vËn ®éng
tõ nh÷ng vÞ trÝ kh¸c trong hÖ gen vµo trong c¸c gen qui ®Þnh
tÝnh tr¹ng mµu néi nhò, lµm “ph¸ vì” nh÷ng gen nµy vµ dÉn
®Õn hiÖn t−îng mµu néi nhò thay ®æi. Ph¸t hiÖn cña
McClintock ban ®Çu ®−îc ®ãn nhËn b»ng nhiÒu “hoµi nghi” vµ
thËm chÝ bÞ ph¶n ®èi. Ph¶i mÊt nhiÒu n¨m sau ®ã, c«ng tr×nh
nghiªn cøu kú c«ng cïng nh÷ng ý t−ëng s©u s¾c cña
McClintock vÒ c¸c yÕu tè vËn ®éng míi ®−îc x¸c nhËn bëi c¸c
nhµ di truyÒn häc vi khuÈn vµ vi sinh vËt khi hä t×m ra c¬ së
ph©n tö cña qu¸ tr×nh vËn ®éng cña nh÷ng yÕu tè nµy.
Sù vËn ®éng cña c¸c transposon vµ
retrotransposon
C¸c sinh vËt nh©n thËt cã hai lo¹i yÕu tè vËn ®éng. Lo¹i thø
nhÊt ®−îc gäi lµ c¸c transposon; lo¹i yÕu tè nµy vËn ®éng
trong hÖ gen th«ng qua mét ADN trung gian. C¸c transposon
cã thÓ vËn ®éng hoÆc bëi c¬ chÕ “c¾t - d¸n” vµ chóng ®−îc
chuyÓn dêi khái vÞ trÝ gèc, hoÆc bëi c¬ chÕ “sao chÐp - d¸n” vµ
chóng ®Ó l¹i mét b¶n sao t¹i vÞ trÝ gèc (H×nh 21.9a).
PhÇn lín c¸c yÕu tè vËn ®éng trong hÖ gen sinh vËt nh©n
thËt thuéc lo¹i thø hai, ®−îc gäi lµ c¸c retrotransposon; lo¹i
yÕu tè nµy vËn ®éng trong hÖ gen th«ng qua mét ARN trung
gian; ®©y lµ b¶n phiªn m· cña chÝnh ADN retrostransposon.
C¸c retrotransposon lu«n ®Ó l¹i mét b¶n sao t¹i vÞ trÝ ®Ých trong
qu¸ tr×nh vËn ®éng, do chóng ®−îc phiªn m· thµnh ARN trung
gian (H×nh 21.9b). Tr−íc khi cµi vµo vÞ trÝ ®Ých, ph©n tö ARN
trung gian ®−îc phiªn m· ng−îc trë l¹i thµnh ADN bëi enzym
phiªn m· ng−îc - reverse transcriptase - do chÝnh
retrotransposon m· hãa. §iÒu nµy cã nghÜa lµ enzym phiªn m·
ng−îc cã thÓ cã mÆt trong c¸c tÕ bµo mµ chóng kh«ng nhÊt
thiÕt ph¶i bÞ l©y nhiÔm bëi retrovirut. (Trong thùc tÕ, c¸c
retrovirut, nh− ®· ®−îc ®Ò cËp ë Ch−¬ng 19, cã thÓ ®· tiÕn hãa
b¾t nguån tõ chÝnh c¸c retrotransposon.) Ho¹t ®éng cµi tr×nh tù
ADN ®−îc phiªn m· ng−îc vµo vÞ trÝ míi ®−îc xóc t¸c bëi
enzym trong tÕ bµo.
H×nh 21.8 ¶nh h−ëng cña c¸c yÕu tè vËn ®éng ®Õn
mµu h¹t ng«. Barbara McClintock lµ ng−êi ®Çu tiªn ®−a ra ý t−ëng vÒ
nh÷ng yÕu tè di truyÒn cã kh¶ n¨ng vËn ®éng khi quan s¸t hiÖn t−îng cã
nhiÒu ®èm mµu kh¸c nhau trong nh©n cña c¸c h¹t ng«. Tuy ban ®Çu ý t−ëng
cña bµ vµo nh÷ng n¨m 1940 ®−îc ®ãn nhËn bëi nh÷ng mèi hoµi nghi, nh−ng
sau nµy ®· ®−îc kiÓm chøng lµ hoµn toµn x¸c thùc. Bµ ®−îc nhËn gi¶i Nobel
n¨m 1983 khi ë tuæi 81 nhê c«ng tr×nh mang tÝnh tiªn phong cña m×nh.
H×nh 21.9 Sù di chuyÓn cña c¸c yÕu tè vËn ®éng
ë sinh vËt nh©n thËt. (a) Sù di chuyÓn cña c¸c transposon hoÆc
theo c¬ chÕ “c¾t - d¸n” hoÆc theo c¬ chÕ “sao chÐp - d¸n” (®−îc minh häa ë
®©y) liªn quan ®Õn mét ph©n tö ADN sîi kÐp trung gian sau ®ã ®−îc cµi vµo
hÖ gen. (b) Sù di chuyÓn cña c¸c retrotransposon b¾t ®Çu b»ng sù h×nh
thµnh mét ph©n tö ARN m¹ch ®¬n trung gian. C¸c b−íc cßn l¹i vÒ b¶n chÊt
gièng víi mét phÇn chu kú sinh s¶n cña retrovirut (xem H×nh 19.8). Trong
kiÓu di chuyÓn cña c¸c transposon theo kiÓu “sao chÐp - d¸n” vµ kiÓu di
chuyÓn cña retrotransposon, tr×nh tù ADN võa ®−îc duy tr× ë vÞ trÝ gèc võa
xuÊt hiÖn ë vÞ trÝ míi.
PhÇn (a) ë trªn sÏ kh¸c nh− thÕ nµo nÕu c¬ chÕ ®−îc minh häa ë ®©y
lµ c¬ chÕ di chuyÓn kiÓu “c¾t - d¸n” ?
Transposon
ADN hÖ gen
Transposon
®−îc sao chÐp
Transposon vËn ®éng
Cµi vµo
hÖ gen
B¶n sao míi
cña transposon
(a) Sù di chuyÓn cña transposon (c¬ chÕ kiÓu “sao chÐp - d¸n”)
Retrotransposon
ARN
Reverse
transcriptase
Cµi vµo
hÖ gen
B¶n sao míi cña
retrotransposon
(b) Sù di chuyÓn cña retrotransposon
- 11. 436 khèi kiÕn thøc 3 Di truyÒn häc
C¸c tr×nh tù liªn quan ®Õn
c¸c yÕu tè vËn ®éng
ë sinh vËt nh©n thËt, nhiÒu b¶n sao cña c¸c yÕu tè vËn ®éng vµ
c¸c tr×nh tù liªn quan ®Õn chóng n»m r¶i r¸c kh¾p hÖ gen. Mçi
®¬n vÞ riªng lÎ cña yÕu tè vËn ®éng th−êng dµi tõ vµi tr¨m ®Õn
vµi ngh×n cÆp baz¬, vµ c¸c b¶n sao n»m ph©n t¸n th−êng
gièng nhau, nh−ng kh«ng gièng hÖt nhau. Mét sè yÕu tè vËn
®éng nh− vËy cã kh¶ n¨ng vËn ®éng; c¸c enzym cÇn thiÕt cho
sù vËn ®éng cña nã cã thÓ ®−îc m· hãa bëi mét yÕu tè vËn
®éng bÊt kú, bao gåm c¶ chÝnh yÕu tè vËn ®éng ®ang ho¹t
®éng. Nh÷ng tr×nh tù kh¸c lµ nh÷ng tr×nh tù cã liªn quan nh−ng
®· mÊt hoµn toµn kh¶ n¨ng vËn ®éng. C¸c yÕu tè vËn ®éng vµ
c¸c tr×nh tù cã liªn quan chiÕm kho¶ng 25% - 50% hÖ gen ë
phÇn lín ®éng vËt cã vó (xem H×nh 21.7); tØ lÖ nµy thËm chÝ
cßn cao h¬n ë c¸c loµi l−ìng c− vµ nhiÒu loµi thùc vËt.
ë ng−êi vµ nhiÒu loµi linh tr−ëng kh¸c, mét tØ lÖ lín c¸c
tr×nh tù ADN liªn quan ®Õn c¸c yÕu tè vËn ®éng bao gåm mét
hä c¸c tr×nh tù gièng nhau ®−îc gäi lµ c¸c yÕu tè Alu. Riªng
nh÷ng tr×nh tù nµy ®· chiÕm kho¶ng 10% hÖ gen ng−êi. C¸c
yÕu tè Alu cã chiÒu dµi kho¶ng 300 nucleotit, tøc lµ ng¾n h¬n
nhiÒu so víi phÇn lín c¸c yÕu tè vËn ®éng cßn ho¹t ®éng kh¸c,
vµ chóng kh«ng m· hãa cho bÊt cø protein nµo. Tuy vËy, nhiÒu
yÕu tè Alu ®−îc phiªn m· thµnh ARN; chøc n¨ng trong tÕ bµo
cña chóng (nÕu cã) ®Õn nay ch−a râ.
Mét tØ lÖ lín h¬n (17%) cña hÖ gen ng−êi lµ mét lo¹i
retrotransposon kh¸c, ®−îc gäi lµ c¸c yÕu tè LINE-1 hay L1.
Nh÷ng yÕu tè nµy dµi h¬n nhiÒu so víi c¸c yÕu tè Alu (kho¶ng
6500 bp) vµ cã tØ lÖ vËn ®éng thÊp. T¹i sao tØ lÖ vËn ®éng cña
c¸c yÕu tè lo¹i nµy l¹i thÊp? C¸c nghiªn cøu gÇn ®©y ph¸t hiÖn
ra r»ng trong c¸c yÕu tè L1 cã c¸c tr×nh tù ng¨n c¶n ho¹t ®éng
cña ARN polymerase vèn cÇn thiÕt cho sù vËn ®éng. Mét
nghiªn cøu bæ sung t×m thÊy c¸c tr×nh tù L1 cã trong intron cña
kho¶ng 80% sè gen ng−êi ®−îc ®em ph©n tÝch, ®iÒu nµy cho
thÊy cã kh¶ n¨ng L1 gióp ®iÒu hßa biÓu hiÖn gen. Mét sè nhµ
nghiªn cøu kh¸c cho r»ng: c¸c retrotransposon L1 cã thÓ cã
hiÖu qu¶ biÖt hãa qua ®iÒu hßa biÓu hiÖn gen dÉn ®Õn sù ph¸t
triÓn c¸c lo¹i n¬ron, gãp phÇn t¹o nªn sù ®a d¹ng cña c¸c lo¹i
tÕ bµo n¬ron (xem Ch−¬ng 48).
MÆc dï cã nhiÒu yÕu tè vËn ®éng m· hãa cho c¸c protein,
nh−ng nh÷ng protein nµy kh«ng thùc hiÖn nh÷ng chøc n¨ng tÕ
bµo b×nh th−êng. Do vËy, c¸c yÕu tè vËn ®éng th−êng ®−îc qui
vµo nhãm ADN “kh«ng m· hãa”, cïng víi c¸c tr×nh tù lÆp l¹i
dµi kh¸c cã trong hÖ gen.
C¸c tr×nh tù ADN lÆp l¹i kh¸c, bao gåm
c¶ c¸c ADN tr×nh tù ®¬n gi¶n
C¸c tr×nh tù ADN lÆp l¹i vèn kh«ng liªn quan ®Õn c¸c yÕu tè
vËn ®éng cã vÎ xuÊt hiÖn do c¸c sai sãt trong c¸c qu¸ tr×nh sao
chÐp hoÆc t¸i tæ hîp cña ADN. Nh÷ng tr×nh tù ADN nh− vËy
chiÕm kho¶ng 15% hÖ gen ng−êi (xem H×nh 21.7). Kho¶ng mét
phÇn ba trong sè nµy (tøc lµ kho¶ng 5 - 6% hÖ gen ng−êi) lµ
nh÷ng ®o¹n ADN dµi lÆp l¹i hai lÇn víi mçi ®¬n vÞ lÆp l¹i dµi tõ
10.000 ®Õn 30.000 cÆp baz¬. C¸c ®o¹n ADN dµi nh− vËy d−êng
nh− ®· ®−îc sao chÐp tõ vÞ trÝ nµy sang vÞ trÝ kh¸c thuéc cïng
mét nhiÔm s¾c thÓ hoÆc thuéc hai nhiÔm s¾c thÓ kh¸c nhau.
Kh«ng gièng nh− c¸c b¶n sao cña c¸c tr×nh tù ADN dµi
ph©n t¸n kh¾p hÖ gen, c¸c ADN tr×nh tù ®¬n gi¶n th−êng gåm
nhiÒu b¶n sao cña c¸c ®o¹n tr×nh tù ng¾n lÆp l¹i liªn tiÕp nh− vÝ
dô ®−îc minh häa d−íi ®©y (ë ®©y, chØ minh häa mét m¹ch):
…GTTACGTTACGTTACGTTACGTTACGTTAC…
Trong tr−êng hîp nµy, ®¬n vÞ lÆp l¹i (GTTAC) gåm 5 nucleotit.
Trong thùc tÕ, c¸c ®¬n vÞ lÆp l¹i nh− vËy cã thÓ dµi ®Õn 500
nucleotit, nh−ng th−êng th× ng¾n h¬n 15 nucleotit nh− vÝ dô
trªn ®©y. Khi ®¬n vÞ lÆp l¹i chØ chøa tõ 2 ®Õn 5 nucleotit, th×
®o¹n tr×nh tù lÆp l¹i liªn tiÕp nh− vËy ®−îc gäi lµ tr×nh tù ng¾n
lÆp l¹i liªn tiÕp, hay cßn gäi lµ STR (short tandem repeats).
Chóng ta ®· nãi vÒ viÖc sö dông chØ thÞ STR trong x©y dùng
tµng th− di truyÒn ë Ch−¬ng 20. Sè b¶n sao cña cïng mét ®¬n
vÞ lÆp l¹i cã thÓ kh¸c nhau ë nh÷ng vÞ trÝ kh¸c nhau trong hÖ
gen. Ch¼ng h¹n nh−, ®¬n vÞ lÆp l¹i GTTAC cã thÓ xuÊt hiÖn liªn
tiÕp hµng tr¨m ngh×n lÇn t¹i mét vÞ trÝ trong hÖ gen; nh−ng ë
mét vÞ trÝ kh¸c, sè lÇn lÆp l¹i cña ®¬n vÞ nµy chØ b»ng mét nöa.
Sè lÇn lÆp l¹i còng rÊt kh¸c nhau gi÷a ng−êi nµy víi ng−êi
kh¸c, t¹o nªn sù kh¸c biÖt trong tµng th− di truyÒn cña mçi c¸
nh©n trªn c¬ së ph©n tÝch c¸c tr×nh tù STR. TÝnh tæng céng, c¸c
ADN tr×nh tù ®¬n gi¶n chiÕm kho¶ng 3% hÖ gen ng−êi.
Thµnh phÇn nucleotit cña c¸c ®o¹n ADN tr×nh tù ®¬n gi¶n
kh¸c biÖt víi thµnh phÇn cña c¸c ®o¹n tr×nh tù ADN kh¸c trong
hÖ gen ®Õn møc chóng t¹o nªn sù kh¸c biÖt vÒ tØ träng. NÕu
ADN hÖ gen ®−îc c¾t thµnh c¸c ph©n ®o¹n nhá, råi ®−îc ly t©m
ë tèc ®é cao, th× c¸c ph©n ®o¹n ADN cã tØ träng kh¸c nhau sÏ
“®Þnh vÞ” ë nh÷ng vÞ trÝ kh¸c nhau trong èng ly t©m. C¸c ®o¹n
ADN lÆp l¹i vèn ban ®Çu ®−îc ph©n lËp theo c¸ch nµy ®−îc gäi
lµ c¸c tr×nh tù ADN vÖ tinh bëi v× c¸c b¨ng ly t©m cña chóng
t¸ch biÖt khái phÇn b¨ng ly t©m chung gåm c¸c tr×nh tù ADN
cßn l¹i cña hÖ gen gièng nh− mét “vÖ tinh”. ThuËt ng÷ “ADN
vÖ tinh” vµ ADN tr×nh tù ®¬n gi¶n hiÖn nay th−êng ®−îc dïng
thay thÕ cho nhau.
Mét l−îng lín ADN tr×nh tù ®¬n gi¶n cña hÖ gen tËp trung
ë c¸c ®Çu mót vµ t©m ®éng cña nhiÔm s¾c thÓ, cho thÊy nh÷ng
tr×nh tù ADN nµy gi÷ vai trß cÊu tróc nhiÔm s¾c thÓ. C¸c tr×nh
tù ADN t¹i t©m ®éng lµ thiÕt yÕu cho ho¹t ®éng ph©n ly cña c¸c
nhiÔm s¾c tö trong qu¸ tr×nh ph©n bµo (xem Ch−¬ng 12). Tr×nh
tù ADN t©m ®éng, cïng víi c¸c ADN tr×nh tù ®¬n gi¶n kh¸c,
cã thÓ ®ãng vai trß tæ chøc chÊt nhiÔm s¾c trong nh©n t¹i kú
trung gian cña chu tr×nh tÕ bµo. C¸c ADN tr×nh tù ®¬n gi¶n t¹i
c¸c ®Çu mót nhiÔm s¾c thÓ gióp b¶o vÖ c¸c gen kh«ng bÞ mÊt do
ADN ng¾n l¹i sau mçi lÇn sao chÐp (xem Ch−¬ng 16). ADN
®Çu mót ®ång thêi liªn kÕt víi c¸c protein gióp b¶o vÖ ®Çu mót
nhiÔm s¾c thÓ khái bÞ biÕn tÝnh, ®ång thêi kh«ng bÞ dÝnh chËp
víi c¸c nhiÔm s¾c thÓ kh¸c.
C¸c gen vµ c¸c hä ®a gen
Chóng ta kÕt thóc bµn luËn vÒ c¸c lo¹i tr×nh tù ADN kh¸c nhau
trong c¸c hÖ gen sinh vËt nh©n thËt b»ng viÖc nh×n gÇn c¸c gen
h¬n. Chóng ta nhí l¹i r»ng tæng céng c¸c tr×nh tù ADN m· hãa
hoÆc cho c¸c protein hoÆc cho c¸c lo¹i tARN vµ rARN chØ
chiÕm cã 1,5% hÖ gen ng−êi (xem H×nh 21.7). NÕu chóng ta
tÝnh c¶ c¸c tr×nh tù intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn
gen, th× tæng céng tÊt c¶ c¸c tr×nh tù ADN cã liªn quan ®Õn gen
(bao gåm c¶ nh÷ng ®o¹n m· hãa vµ kh«ng m· hãa) chiÕm
- 12. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 437
kho¶ng 25% hÖ gen ng−êi. Nãi c¸ch kh¸c, trung b×nh chØ cã
kho¶ng 6% (tøc lµ 1,5% cña 25%) tr×nh tù ®Çy ®ñ cña mét gen
cã mÆt trong s¶n phÈm cuèi cïng cña gen.
Gièng víi c¸c gen cña vi khuÈn, nhiÒu gen ë sinh vËt nh©n
thËt lµ nh÷ng tr×nh tù ®¬n nhÊt vµ chØ cã mét b¶n sao duy nhÊt
trong mçi bé nhiÔm s¾c thÓ ®¬n béi. Tuy vËy, trong hÖ gen
ng−êi vµ hÖ gen cña nhiÒu ®éng vËt vµ thùc vËt kh¸c, nh÷ng
gen “®¬n ®éc” nh− vËy chiÕm Ýt h¬n mét nöa tæng sè tr×nh tù
ADN ®−îc phiªn m·. C¸c gen cßn l¹i xuÊt hiÖn thµnh c¸c hä
®a gen, tøc lµ tËp hîp cña hai hay nhiÒu gen gièng hÖt hoÆc rÊt
gièng nhau.
Trong c¸c hä ®a gen gåm c¸c tr×nh tù ADN gièng hÖt nhau,
c¸c tr×nh tù ADN lÆp l¹i liÒn kÒ nhau, vµ ngo¹i trõ c¸c gen m·
hãa protein histone, chóng m· hãa cho s¶n phÈm cuèi cïng lµ
ARN. Mét vÝ dô vÒ hä c¸c tr×nh tù ADN gièng hÖt nhau lµ côm
c¸c gen m· hãa cho ba lo¹i ph©n tö rARN lín nhÊt (H×nh
21.10a). Nh÷ng ph©n tö rARN nµy ®−îc phiªn m· thµnh c¸c
b¶n phiªn m· duy nhÊt gåm hµng tr¨m thËm chÝ hµng ngh×n lÇn
lÆp l¹i kÕ tiÕp nhau vµ tËp hîp thµnh mét hoÆc mét sè côm
trong hÖ gen sinh vËt nh©n thËt. Víi nhiÒu b¶n sao cïng cã mÆt
trong mét ®¬n vÞ phiªn m· nh− vËy, tÕ bµo cã thÓ nhanh chãng
t¹o ra hµng triÖu ribosome cÇn cho qu¸ tr×nh tæng hîp protein.
B¶n phiªn m· s¬ cÊp cña c¸c gen rARN sau ®ã ®−îc c¾t xÐn ®Ó
h×nh thµnh nªn ba lo¹i ph©n tö rARN. Nh÷ng ph©n tö rARN
nµy sau ®ã ®−îc kÕt hîp víi c¸c protein vµ mét lo¹i rARN kh¸c
(rARN 5S) ®Ó t¹o nªn c¸c tiÓu phÇn ribosome.
C¸c vÝ dô kinh ®iÓn vÒ c¸c hä ®a gen cã tr×nh tù kh«ng
gièng hÖt nhau gåm hai hä gen cã quan hÖ víi nhau m· hãa cho
globin; ®©y lµ mét nhãm c¸c protein gåm c¸c tiÓu phÇn (chuçi
polypeptit) α vµ β cña hemoglobin. Cã mét hä gen n»m trªn
NST sè 16 ë ng−êi m· hãa cho c¸c d¹ng kh¸c nhau cña α-
globin; mét hä gen cßn l¹i n»m trªn NST sè 11 m· hãa cho c¸c
d¹ng kh¸c nhau cña β-globin (H×nh 21.10b). C¸c d¹ng kh¸c
nhau cña mçi tiÓu phÇn globin ®−îc biÓu hiÖn vµo c¸c thêi
®iÓm kh¸c nhau cña qu¸ tr×nh ph¸t triÓn, qua ®ã gióp
hemoglobin biÓu hiÖn chøc n¨ng hiÖu qu¶ trong c¸c ®iÒu kiÖn
m«i tr−êng thay ®æi trong qu¸ tr×nh ph¸t triÓn ë ®éng vËt.
Ch¼ng h¹n nh−, ë ng−êi, c¸c d¹ng hemoglobin cã trong ph«i vµ
thai cã ¸i lùc víi oxy cao h¬n so víi d¹ng hemoglobin ë ng−êi
tr−ëng thµnh; ®iÒu nµy gióp ®¶m b¶o hiÖu qu¶ vËn chuyÓn oxy
tõ mÑ sang thai nhi. Trong c¸c côm hä gen m· hãa globin,
ng−êi ta cßn t×m thÊy mét sè gen gi¶.
H×nh 21.10 C¸c hä gen.
Trong phÇn (a) cña trªn h×nh, b»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh ®−îc chiÒu phiªn m·, nÕu nh− kh«ng cã mòi tªn mµu ®á?
Nh©n hem
Hä gen α-globin
ADN
Hä gen β-globin
NhiÔm s¾c thÓ sè 16 NhiÔm s¾c thÓ sè 11
Ph«i
Thai vµ ng−êi
tr−ëng thµnh Ph«i Thai Ng−êi tr−ëng
thµnh
§o¹n ®Öm kh«ng
®−îc phiªn m· §¬n vÞ phiªn m·
C¸c b¶n
phiªn m· ARN
ADN
rARN
(a) Mét phÇn hä gen m hãa ARN ribosom. Ba trong sè hµng
tr¨m b¶n sao cña c¸c ®¬n vÞ phiªn m· rARN trong hÖ gen cña loµi kú
gi«ng ®−îc minh häa ë phÇn trªn (¶nh TEM). Mçi mét “chiÕc l«ng” t−¬ng
øng víi mét ®¬n vÞ phiªn m· víi kho¶ng 100 ph©n tö ®ang ®−îc tæng hîp
bëi ARN polymerase (®iÓm mµu sÉm däc theo sîi ADN) dÞch chuyÓn tõ
tr¸i qua ph¶i. C¸c b¶n phiªn m· ARN ®ang ®−îc “më réng” tõ ADN. S¬ ®å
bªn d−íi ¶nh TEM m« t¶ mét ®¬n vÞ phiªn m·. Nã bao gåm c¸c gen (mµu
xanh lam) m· hãa ba lo¹i rARN xen gi÷a c¸c vïng ®−îc phiªn m· nh−ng
sau ®ã ®−îc c¾t bá (mµu vµng). Ban ®Çu chØ mét b¶n phiªn m· ARN duy
nhÊt ®−îc t¹o ra, nh−ng sau ®ã nã ®−îc c¾t xÐn ®Ó t¹o nªn ba ph©n tö
rARN kh¸c nhau (mçi lo¹i mét ph©n tö); chóng lµ c¸c thµnh phÇn thiÕt yÕu
cña ribosom. Mét lo¹i rARN thø t− (5S rARN) còng lµ thµnh phÇn cña
ribosom, nh−ng gen m· hãa nã kh«ng thuéc cïng ®¬n vÞ phiªn m· nµy.
(b) C¸c hä gen α
α
α
α-globin vµ β
β
β
β-globin ë ng−êi. Hemoglobin ®−îc
cÊu t¹o tõ hai tiÓu phÇn (chuçi) polypeptide lo¹i α-globin vµ hai tiÓu phÇn
lo¹i β-globin. C¸c gen (mµu xanh lam) m· hãa cho α-globin vµ β-globin
®−îc t×m thÊy trong hai hä gen cã cÊu tróc tæ chøc nh− minh häa trªn
h×nh. C¸c tr×nh tù ADN kh«ng m· hãa xen gi÷a c¸c gen chøc n¨ng trong
mçi hä gen gåm c¸c gen gi¶ (mµu xanh lôc) vµ c¸c d¹ng biÕn ®æi kh«ng
biÓu hiÖn chøc n¨ng cña c¸c gen chøc n¨ng b×nh th−êng. Tªn gäi c¸c
gen vµ c¸c gen gi¶ ®−îc kÝ hiÖu vµ ®äc theo tiÕng Hy l¹p.
- 13. 438 khèi kiÕn thøc 3 Di truyÒn häc
Sù s¾p xÕp c¸c gen thµnh c¸c hä gen ®· gióp c¸c nhµ sinh
häc cã nh÷ng hiÓu biÕt s©u h¬n vÒ qu¸ tr×nh tiÕn hãa cña c¸c hÖ
gen. Trong môc tiÕp theo, chóng ta sÏ ®Ò cËp ®Õn mét sè qu¸
tr×nh dÉn ®Õn sù ®Þnh h×nh c¸c hÖ gen cña c¸c loµi kh¸c nhau
qua qu¸ tr×nh tiÕn hãa.
C¬ së thay ®æi ë cÊp ®é hÖ gen lµ ®ét biÕn vµ ®ã còng lµ nÒn
t¶ng cña tiÕn hãa häc hÖ gen. D−êng nh− nh÷ng d¹ng sèng ®Çu
tiªn chØ chøa mét sè tèi thiÓu c¸c gen, nghÜa lµ chØ cã c¸c gen
thiÕt yÕu cho sù tån t¹i vµ sinh s¶n. NÕu ®iÒu nµy lµ ®óng, th×
mét chiÒu h−íng tiÕn hãa h¼n lµ ®· diÔn ra cïng víi sù t¨ng lªn
vÒ kÝch th−íc hÖ gen, vµ vËt chÊt di truyÒn bæ sung ®· cung cÊp
nguyªn liÖu s¬ cÊp cho tÝnh ®a d¹ng t¨ng lªn cña c¸c gen.
Trong môc nµy, ®Çu tiªn chóng ta sÏ m« t¶ b»ng c¸ch nµo
nh÷ng b¶n sao bæ sung cña toµn bé hay mét phÇn cña hÖ gen cã
thÓ xuÊt hiÖn, råi sau ®ã ®Ò cËp ®Õn nh÷ng qu¸ tr×nh x¶y ra tiÕp
theo dÉn ®Õn sù tiÕn hãa cña c¸c protein (hoÆc c¸c s¶n phÈm
ARN) cã chøc n¨ng hoµn toµn míi hoÆc thay ®æi chót Ýt.
Sù nh©n ®«i c¸c bé nhiÔm s¾c thÓ
C¸c sù kiÖn ngÉu nhiªn trong gi¶m ph©n cã thÓ dÉn ®Õn tÕ bµo
cã thÓ cã mét hoÆc nhiÒu bé nhiÔm s¾c thÓ bæ sung thªm; hiÖn
t−îng nµy ®−îc gäi lµ ®a béi thÓ. MÆc dï, trong phÇn lín
tr−êng hîp nh÷ng sù kiÖn ngÉu nhiªn ®ã th−êng g©y chÕt,
nh−ng trong mét sè hiÕm tr−êng hîp, chóng l¹i thóc ®Èy sù tiÕn
hãa cña c¸c gen. ë mét c¬ thÓ ®a béi, mét bé c¸c gen cã thÓ
cung cÊp ®ñ c¸c chøc n¨ng thiÕt yÕu cho c¬ thÓ ®ã. Nh÷ng gen
ë nh÷ng bé nhiÔm s¾c thÓ bæ sung cã thÓ ph©n ly bëi qu¸ tr×nh
tÝch lòy c¸c ®ét biÕn; nh÷ng biÕn dÞ nµy cã thÓ ®−îc duy tr× nÕu
nh− c¬ thÓ mang c¸c ®ét biÕn sèng sãt vµ sinh s¶n ®−îc. B»ng
c¸ch ®ã, c¸c gen cã thÓ tiÕn hãa víi nh÷ng chøc n¨ng míi.
Cïng víi viÖc mét b¶n sao cña gen thiÕt yÕu ®−îc biÓu hiÖn, sù
ph©n ly cña mét b¶n sao kh¸c cã thÓ dÉn ®Õn mét lo¹i protein
vÉn do gen ®ã m· hãa song ho¹t ®éng theo mét c¸ch míi, qua
®ã lµm thay ®æi kiÓu h×nh cña sinh vËt. KÕt qu¶ cña sù tÝch lòy
c¸c ®ét biÕn nµy cã thÓ dÉn ®Õn sù ph©n nh¸nh tiÕn hãa cña mét
loµi míi, gièng nh− biÓu hiÖn th−êng thÊy ë thùc vËt (xem
Ch−¬ng 24). C¸c ®éng vËt ®a béi còng tån t¹i, song rÊt hiÕm.
Sù thay ®æi cÊu tróc nhiÔm s¾c thÓ
Tõ l©u c¸c nhµ khoa häc ®· biÕt r»ng vµo mét thêi ®iÓm nµo ®ã
trong vßng 6 triÖu n¨m tr−íc khi c¸c d¹ng tæ tiªn cña ng−êi
hiÖn ®¹i vµ tinh tinh ph©n ly khái nhau vµ h×nh thµnh nªn c¸c
loµi riªng biÖt, mét sù dung hîp hai nhiÔm s¾c thÓ kh¸c nhau
vèn cã ë d¹ng tæ tiªn ®· dÉn ®Õn loµi ng−êi cã sè nhiÔm s¾c thÓ
®¬n béi (n = 23) kh¸c víi cña tinh tinh (n = 24). Víi sù bïng
næ th«ng tin vÒ tr×nh tù c¸c hÖ gen, giê ®©y chóng ta cã thÓ so
s¸nh cÊu tróc vµ tæ chøc nhiÔm s¾c thÓ gi÷a nhiÒu loµi ë cÊp ®é
ph©n tÝch chi tiÕt h¬n. Nh÷ng th«ng tin nµy gióp chóng ta cã thÓ
t×m hiÓu s©u h¬n vÒ c¸c qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù h×nh
thµnh c¸c nhiÔm s¾c thÓ còng nh− sù ph¸t sinh c¸c loµi.
VÝ dô nh−, trong mét nghiªn cøu, c¸c nhµ khoa häc ®· tiÕn
hµnh so s¸nh tr×nh tù ADN gi÷a mçi nhiÔm s¾c thÓ cña ng−êi
víi tr×nh tù toµn bé hÖ gen cña chuét. H×nh 21.11 cho thÊy kÕt
qu¶ so s¸nh víi nhiÔm s¾c thÓ sè 16 cña ng−êi lµ: nh÷ng “khèi”
gen lín trªn nhiÔm s¾c thÓ nµy ®−îc t×m thÊy trªn 4 nhiÔm s¾c
thÓ kh¸c nhau cña chuét; ®iÒu nµy cho thÊy c¸c gen trong mçi
“khèi” ®· tån t¹i cïng víi nhau trong qu¸ tr×nh tiÕn hãa cña
21.5
Kh¸i niÖm
LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét
biÕn trong tr×nh tù ADN ®ãng
gãp vµo qu¸ tr×nh tiÕn hãa
21.4
1. H·y nªu c¸c ®Æc ®iÓm cña hÖ gen ®éng vËt cã vó lµm
chóng trë nªn lín h¬n so víi c¸c hÖ gen sinh vËt nh©n s¬?
2. C¸c intron, c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù ADN lÆp
l¹i ®¬n gi¶n ph©n bè trong hÖ gen kh¸c nhau nh− thÕ nµo?
3. Nªu sù kh¸c nhau trong cÊu tróc cña c¸c hä gen m· hãa
rARN vµ m· hãa c¸c protein globin ë ng−êi. Víi mçi hä
gen, h·y gi¶i thÝch lîi thÕ cña sù tån t¹i cÊu tróc kiÓu hä
gen ®èi víi sinh vËt.
4. Gi¶ sö b¹n t×m thÊy mét tr×nh tù ADN
gièng víi tr×nh tù cña mét gen ®· biÕt, nh−ng chóng l¹i
kh¸c nhau râ rÖt ë mét vµi nucleotide nhÊt ®Þnh. B»ng
c¸ch nµo b¹n cã thÓ x¸c ®Þnh tr×nh tù míi t×m thÊy cã
ph¶i lµ mét “gen” biÓu hiÖn chøc n¨ng hay kh«ng??
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
H×nh 21.11 C¸c khèi tr×nh tù gièng nhau trªn c¸c
nhiÔm s¾c thÓ cña ng−êi vµ chuét. C¸c tr×nh tù ADN rÊt gièng
nhau ®−îc t×m thÊy trong mét khèi tr×nh tù lín thuéc nhiÔm s¾c thÓ sè 16 cña
ng−êi ®−îc t×m thÊy trªn c¸c nhiÔm s¾c thÓ sè 7, 8, 16 vµ 17 cña chuét. §iÒu
nµy cho thÊy c¸c tr×nh tù ADN trong mçi khèi ®· lu«n tån t¹i cïng nhau ë c¸c
dßng tiÕn hãa dÉn ®Õn sù h×nh thµnh ng−êi vµ chuét kÓ tõ thêi ®iÓm chóng
ph©n ly khái nhau tõ tæ tiªn chung.
NhiÔm s¾c thÓ sè 16 cña ng−êi
C¸c khèi
tr×nh tù ADN
C¸c khèi tr×nh tù t−¬ng øng ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ cña chuét
- 14. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 439
chuét còng nh− ë c¸c nh¸nh tiÕn hãa cña ng−êi. Thùc hiÖn phÐp
so s¸nh t−¬ng tù gi÷a nhiÔm s¾c thÓ cña ng−êi víi s¸u loµi ®éng
vËt cã vó kh¸c còng ®· gióp c¸c nhµ nghiªn cøu t¸i thiÕt ®−îc
lÞch sö tiÕn hãa tæ chøc nhiÔm s¾c thÓ ë t¸m loµi ®éng vËt cã vó
nµy. Qua ®ã, c¸c nhµ nghiªn cøu ®· t×m ra nhiÒu lÆp ®o¹n vµ
®¶o ®o¹n trªn c¸c ph©n ®o¹n lín cña NST lµ kÕt qu¶ cña c¸c lçi
t¸i tæ hîp x¶y ra trong gi¶m ph©n dÉn ®Õn sù ®øt g·y vµ nèi l¹i
kh«ng chÝnh x¸c cña ADN. TÇn sè suÊt hiÖn nh÷ng sù kiÖn nµy
d−êng nh− ®· t¨ng nhanh trong kho¶ng 100 triÖu n¨m tr−íc, tøc
lµ kho¶ng thêi gian nh÷ng loµi khñng long kÝch th−íc lín trë
nªn tuyÖt chñng vµ sè loµi ®éng vËt cã vó t¨ng lªn nhanh
chãng. Sù trïng lÆp ngÉu nhiªn nµy râ rµng lµ rÊt thó vÞ bëi v×
sù t¸i s¾p xÕp nhiÔm s¾c thÓ ®−îc cho lµ ®· ®ãng gãp vµo sù
h×nh thµnh c¸c loµi míi. MÆc dï hai c¸ thÓ mang c¸c nhiÔm s¾c
thÓ ®−îc s¾p xÕp kh¸c nhau vÉn cã thÓ giao phèi víi nhau vµ
sinh s¶n, nh−ng c¸c c¸ thÓ con sinh ra sÏ cã hai bé nhiÔm s¾c
thÓ kh«ng t−¬ng ®ång. V× vËy, sù s¾p xÕp l¹i c¸c nhiÔm s¾c thÓ
cã thÓ dÉn ®Õn sù h×nh thµnh hai quÇn thÓ kh«ng cßn cã kh¶
n¨ng giao phèi víi nhau n÷a, vµ nã trë thµnh mét b−íc trong
con ®−êng dÉn ®Õn sù h×nh thµnh hai loµi t¸ch biÖt (chóng ta sÏ
®Ò cËp kü h¬n vÒ vÊn ®Ò nµy ë Ch−¬ng 24).
§iÒu g©y ng¹c nhiªn mét chót lµ nh÷ng nghiªn cøu t−¬ng tù
®· ph¸t hiÖn ra nh÷ng mèi liªn quan ®Õn y häc. ViÖc ph©n tÝch
c¸c ®iÓm ®øt g·y nhiÔm s¾c thÓ liªn quan ®Õn sù t¸i s¾p xÕp cña
chóng cho thÊy nh÷ng ®iÓm nµy kh«ng hÒ ph©n bè ngÉu nhiªn,
mµ chóng lµ nh÷ng ®iÓm ®Æc thï ®−îc dïng ®i dïng l¹i nhiÒu
lÇn. NhiÒu “®iÓm nãng” t¸i tæ hîp nh− vËy t−¬ng øng víi vÞ trÝ
s¾p xÕp l¹i nhiÔm s¾c thÓ trong hÖ gen ng−êi vèn cã liªn quan
®Õn c¸c bÖnh bÈm sinh. TÊt nhiªn, c¸c nhµ nghiªn cøu cßn quan
t©m c¶ nh÷ng vÞ trÝ kh¸c cã thÓ liªn quan ®Õn nh÷ng bÖnh cho
®Õn nay ch−a ®−îc x¸c ®Þnh.
LÆp ®o¹n vµ sù ph©n ly cña c¸c vïng
ADN cã kÝch th−íc t−¬ng øng víi gen
C¸c lçi trong gi¶m ph©n còng cã thÓ dÉn ®Õn hiÖn t−îng lÆp c¸c
vïng nhiÔm s¾c thÓ cã kÝch th−íc nhá h¬n nh÷ng vïng lÆp mµ
chóng ta ®· ®Ò cËp trªn ®©y, trong ®ã bao gåm c¸c vïng t−¬ng
øng víi chiÒu dµi cña c¸c gen ®¬n lÎ. Ch¼ng h¹n nh−, trao ®æi
chÐo kh«ng c©n trong kú ®Çu gi¶m ph©n I cã thÓ dÉn ®Õn mét
nhiÔm s¾c thÓ mÊt ®o¹n, trong khi mét nhiÔm s¾c thÓ kh¸c lÆp
®o¹n. Nh− minh häa trªn H×nh 21.12, c¸c yÕu tè vËn ®éng trong
hÖ gen lµ nh÷ng vÞ trÝ mµ c¸c nhiÔm s¾c tö kh«ng chÞ em cã thÓ
trao ®æi chÐo víi nhau, thËm chÝ ngay c¶ khi chóng kh«ng cã
nh÷ng tr×nh t−¬ng ®ång xÕp th¼ng hµng chÝnh x¸c víi nhau.
Ngoµi ra, hiÖn t−îng “tr−ît” cã thÓ x¶y ra trong sao chÐp
ADN, ch¼ng h¹n nh− m¹ch lµm khu«n xª dÞch so víi m¹ch
t−¬ng ®ång míi ®−îc tæng hîp, hoÆc mét phÇn cña m¹ch lµm
khu«n bÞ bé m¸y sao chÐp bá qua hay trong tr−êng hîp kh¸c nã
®−îc dïng lµm khu«n hai lÇn. KÕt qu¶ lµ mét ph©n ®o¹n ADN
bÞ mÊt ®i hoÆc lÆp l¹i. Cã thÓ dÔ dµng t−ëng t−îng ra c¸ch mµ
nh÷ng lçi nh− vËy cã thÓ xuÊt hiÖn trong c¸c vïng tr×nh tù lÆp
l¹i gièng nh− c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ®· ®−îc m« t¶ ë
trªn. C¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n víi sè l−îng biÕn ®éng
t¹i mét vÞ trÝ nhÊt ®Þnh, vèn ®−îc dïng cho ph©n tÝch STR, cã
thÓ lµ do nh÷ng lçi gièng nh− vËy. C¸c b»ng chøng vÒ trao ®æi
chÐo kh«ng c©n vµ hiÖn t−îng “tr−ît” cña m¹ch khu«n trong
sao chÐp ADN dÉn ®Õn lÆp gen ®−îc t×m thÊy ë nhiÒu hä ®a gen
tån t¹i trong c¸c hÖ gen hiÖn nay.
Sù tiÕn hãa c¸c gen cã chøc n¨ng liªn
quan víi nhau: C¸c gen globin ë ng−êi
C¸c sù kiÖn lÆp ®o¹n nhiÔm s¾c thÓ hay lÆp gen cã thÓ dÉn ®Õn
sù tiÕn hãa cña c¸c gen cã chøc n¨ng liªn quan ®Õn nhau, ch¼ng
h¹n nh− c¸c hä gen m· hãa cho α-globin vµ β-globin (xem
H×nh 21.10b). ViÖc so s¸nh c¸c tr×nh tù gen trong mét hä ®a
gen cã thÓ chØ ra thø tù c¸c gen xuÊt hiÖn. C¸ch tiÕp cËn ®Ó “t¸i
t¹o” l¹i lÞch sö tiÕn hãa cña c¸c gen m· hãa globin ®· chØ ra
r»ng tÊt c¶ nh÷ng gen nµy ®Òu cã nguån gèc tõ mét gen globin
tæ tiªn chung; gen tæ tiªn nµy ®· tr¶i qua hiÖn t−îng lÆp gen råi
ph©n ly thµnh c¸c gen α-globin vµ β-globin tæ tiªn kho¶ng 450
- 500 triÖu n¨m tr−íc (H×nh 21.13, ë trang sau). Mçi gen tæ tiªn
nµy sau ®ã tiÕp tôc ®−îc nh©n ®«i mét vµi lÇn, råi nh÷ng b¶n
sao cña chóng ph©n ly khái nhau vÒ tr×nh tù, dÉn ®Õn h×nh
thµnh c¸c gen thµnh viªn thuéc hä gen nh− hiÖn nay. Trong
thùc tÕ, gen globin tæ tiªn chung còng cã thÓ lµ nguån gèc cña
gen m· hãa protein c¬ liªn kÕt «xy cã tªn gäi lµ myoglobin vµ
protein ë thùc vËt lµ leghemoglobin. Hai lo¹i protein nµy hoÆc
®éng ë d¹ng ®¬n ph©n, vµ c¸c gen cña chóng thuéc “siªu hä
globin”.
TiÕp theo sau c¸c sù kiÖn lÆp gen, sù kh¸c biÖt gi÷a c¸c gen
trong c¸c hä globin râ rµng xuÊt ph¸t tõ c¸c ®ét biÕn ®−îc tÝch
lòy trong c¸c b¶n sao cña gen qua nhiÒu thÕ hÖ. VÝ dô, mét m«
h×nh hiÖn nay cho r»ng chøc n¨ng thiÕt yÕu cña protein α-
globin tr−íc ®©y cã thÓ ®−îc ®¸p øng chØ bëi mét gen duy nhÊt,
do vËy c¸c b¶n sao kh¸c cña gen α-globin ®· cã thÓ tÝch lòy c¸c
®ét biÕn ngÉu nhiªn. RÊt nhiÒu ®ét biÕn cã thÓ ®· g©y h¹i cho
H×nh 21.12 LÆp gen do trao ®æi chÐo kh«ng c©n. Mét
c¬ chÕ mµ qua ®ã mét gen (hoÆc mét ®o¹n ADN kh¸c) cã thÓ bÞ
lÆp l¹i (nh©n ®«i) lµ sù t¸i tæ hîp x¶y ra trong qu¸ tr×nh gi¶m
ph©n gi÷a c¸c b¶n sao kh¸c nhau cña mét yÕu tè vËn ®éng
n»m s¸t vïng biªn cña c¸c gen. Sù t¸i tæ hîp nh− vËy x¶y ra do
sù “s¾p hµng lÖch” cña hai nhiÔm s¾c tö kh«ng chÞ em thuéc
cÆp nhiÔm s¾c thÓ t−¬ng ®ång dÉn ®Õn sù h×nh thµnh mét
nhiÔm s¾c tö mang hai b¶n sao cña gen, trong khi nhiÔm s¾c tö
cßn l¹i th× kh«ng cã b¶n sao nµo cña gen ®ã.
YÕu tè
vËn ®éng
Gen
C¸c nhiÔm s¾c
tö kh«ng chÞ em
VÞ trÝ
trao ®æi chÐo
Sù b¾t cÆp kh«ng
chÝnh x¸c cña hai
nhiÔm s¾c thÓ t−¬ng
®ång trong gi¶m ph©n
vµ
- 15. 440 khèi kiÕn thøc 3 Di truyÒn häc
c¬ thÓ sinh vËt, trong khi mét sè ®ét biÕn kh¸c kh«ng g©y hËu
qu¶ g×, nh−ng cã mét sè Ýt ®ét biÕn h¼n lµ ®· lµm thay ®æi chøc
n¨ng cña s¶n phÈm protein theo c¸ch cã lîi cho c¬ thÓ sinh vËt
vµo mét giai ®o¹n sèng nhÊt ®Þnh cña nã ®ång thêi kh«ng lµm
thay ®æi chøc n¨ng vËn chuyÓn «xy cña protein. Cã thÓ gi¶ thiÕt
r»ng: chän läc tù nhiªn ®· t¸c ®éng lªn nh÷ng gen nµy vµ duy
tr× chóng trong quÇn thÓ.
Sù gièng nhau vÒ c¸c tr×nh tù axit amin cña c¸c chuçi
polypeptit α-globin vµ β-globin ñng hé cho m« h×nh lÆp gen vµ
tÝch lòy ®ét biÕn (B¶ng 21.2). Ch¼ng h¹n nh−, tr×nh tù axit
amin cña c¸c β-globin gièng nhau h¬n rÊt nhiÒu so víi tr×nh tù
cña α-globin. Sù tån t¹i cña mét sè gen gi¶ n»m gi÷a c¸c gen
globin ho¹t ®éng lµ mét b»ng chøng bæ sung kh¸c ñng hé cho
m« h×nh nµy (xem H×nh 21.10b). C¸c ®ét biÕn ngÉu nhiªn x¶y
ra ë nh÷ng “gen” nµy qua thêi gian tiÕn hãa cã thÓ ®· lµm háng
sù biÓu hiÖn chøc n¨ng b×nh th−êng cña chóng.
TiÕn hãa cña c¸c gen cã chøc n¨ng míi
Trong qu¸ tr×nh tiÕn hãa cña c¸c hä gen globin, hiÖn t−îng lÆp
gen vµ ph©n ly sau ®ã ®· t¹o nªn c¸c gen thµnh viªn mµ s¶n
phÈm cña chóng ®Òu thùc hiÖn chøc n¨ng gièng nhau (vËn
chuyÓn «xy). Theo mét c¸ch kh¸c, mét b¶n sao cña gen ®−îc
nh©n ®«i cã thÓ tr¶i qua nh÷ng biÕn ®æi dÉn ®Õn sù xuÊt hiÖn
mét chøc n¨ng hoµn toµn míi cña s¶n phÈm protein. C¸c gen
m· hãa lysozyme vµ α-lactalbumin lµ mét vÝ dô nh− vËy.
Lysozyme lµ mét enzym gióp b¶o vÖ c¬ thÓ ®éng vËt khái
sù l©y nhiÔm cña vi khuÈn b»ng viÖc xóc t¸c thñy ph©n thµnh tÕ
bµo vi khuÈn; α-lactalbumin lµ mét protein kh«ng cã chøc n¨ng
enzym, thay vµo ®ã nã gi÷ vai trß trong qu¸ tr×nh s¶n xuÊt s÷a ë
®éng vËt cã vó. Hai protein nµy rÊt gièng nhau vÒ tr×nh tù axit
amin vµ cÊu tróc kh«ng gian ba chiÒu. C¶ hai gen ®−îc t×m thÊy
®ång thêi cã mÆt ë c¸c loµi ®éng vËt cã vó, nh−ng ë chim chØ
t×m thÊy gen m· hãa lysozyme. §iÒu nµy chØ ra r»ng vµo mét
thêi ®iÓm nhÊt ®Þnh nµo ®ã trong qu¸ khø, sau khi c¸c nh¸nh
dÉn ®Õn h×nh thµnh c¸c loµi ®éng vËt cã vó
vµ chim ph©n ly khái nhau, gen lysozyme
®· tr¶i qua mét sù kiÖn lÆp gen trong nh¸nh
tiÕn hãa h×nh thµnh c¸c ®éng vËt cã x−¬ng
sèng, nh−ng kh«ng x¶y ra trong nh¸nh tiÕn
hãa cña chim. Cuèi cïng, mét b¶n sao cña
gen lysozym ®· ®−îc nh©n ®«i dÉn ®Õn sù
tiÕn hãa h×nh thµnh gen m· hãa α-
lactanbomin vèn lµ mét protein cã chøc
n¨ng kh¸c biÖt ho¹t toµn.
Sù s¾p xÕp l¹i c¸c phÇn cña
gen: nh©n ®«i vµ tr¸o exon
Sù s¾p xÕp l¹i c¸c tr×nh tù ADN s½n cã
trong c¸c gen còng ®· gãp phÇn vµo sù tiÕn
hãa hÖ gen. Sù cã mÆt cña intron trong phÇn
lín c¸c gen ë sinh vËt nh©n thËt ®a bµo cã
thÓ ®· thóc ®Èy sù tiÕn hãa cña c¸c protein
cã tiÒm n¨ng h÷u dông míi b»ng viÖc gia
t¨ng hiÖn t−îng lÆp ®o¹n hay s¾p xÕp l¹i vÞ
trÝ cña c¸c exon trong hÖ gen. Chóng ta nhí
l¹i tõ Ch−¬ng 17 r»ng mçi exon th−êng m·
hãa cho mét miÒn cã cÊu tróc vµ chøc n¨ng
®Æc thï cña protein.
Chóng ta còng ®· biÕt trao ®æi chÐo
kh«ng c©n trong qu¸ tr×nh gi¶m ph©n cã thÓ
dÉn ®Õn hiÖn t−îng lÆp gen trªn mét nhiÔm
s¾c thÓ ®ång thêi lµm mÊt gen trªn nhiÔm
s¾c thÓ t−¬ng ®ång víi nã (xem H×nh
21.12). B»ng mét qu¸ tr×nh t−¬ng tù, mét
exon nhÊt ®Þnh trong gen cã thÓ bÞ nh©n ®«i
trªn mét nhiÔm s¾c thÓ, song l¹i bÞ mÊt ®i
trªn nhiÔm s¾c thÓ kia. C¸c gen mang c¸c
exon lÆp l¹i cã thÓ m· hãa cho mét lo¹i
protein chøa hai b¶n sao cña mét miÒn
protein. Sù thay ®æi nµy trong cÊu tróc cã
thÓ lµm t¨ng c−êng sù biÓu hiÖn chøc n¨ng
cña protein nÕu protein ®ã lóc nµy trë nªn
æn ®Þnh h¬n, vµ t¨ng kh¶ n¨ng liªn kÕt víi
mét chÊt g¾n nhÊt ®Þnh hoÆc lµm thay ®æi
mét sè thuéc tÝnh kh¸c. Kh¸ nhiÒu gen m·
H×nh 21.13 Mét m« h×nh tiÕn hãa cña c¸c hä gen α-globin vµ β-globin
tõ gen globin “tæ tiªn” duy nhÊt.
C¸c yÕu tè tr×nh tù mµu xanh lôc lµ c¸c gen gi¶. H·y gi¶i thÝch b»ng c¸ch nµo chóng cã thÓ xuÊt hiÖn
sau khi ®· x¶y ra c¸c sù kiÖn lÆp gen.
B¶ng 21.2 TØ lÖ gièng nhau trong tr×nh tù axit amin
gi÷a c¸c protein globin ë ng−êi
Gen globin “tæ tiªn”
Gen “tæ tiªn” ®−îc
nh©n ®«i (lÆp gen)
§ét biÕn tÝch lòy ë
c¶ hai b¶n sao
VËn ®éng tíi c¸c
nhiÔm s¾c thÓ kh¸c
TiÕp tôc lÆp gen vµ
tÝch lòy ®ét biÕn
Hä gen α-globin trªn
nhiÔm s¾c thÓ sè 16
Hä gen α-globin trªn
nhiÔm s¾c thÓ sè 11
Thêi
gian
tiÕn
hãa
C¸c lo¹i α
α
α
α-globin C¸c lo¹i β
β
β
β-globin
C¸c lo¹i
α
α
α
α-globin
C¸c lo¹i
β
β
β
β-globin