O slideshow foi denunciado.
Seu SlideShare está sendo baixado. ×

[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf

Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
426
21.1. C¸c ph−¬ng ph¸p míi ® gióp gia t¨ng tèc ®é
gi¶i tr×nh tù c¸c hÖ gen
21.2. C¸c nhµ khoa häc øng dông tin sinh häc...
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 427
ViÖc gi¶i tr×nh tù hÖ gen ng−êi, mét dù ¸n tham väng víi tªn
gäi Dù ¸n H...
428 khèi kiÕn thøc 3 Di truyÒn häc
vect¬ plasmid hoÆc phag¬, tr−íc khi nh÷ng ph©n ®o¹n nhá nµy
®−îc dïng ®Ó gi¶i tr×nh tù ...
Anúncio
Anúncio
Anúncio
Anúncio
Próximos SlideShares
GEN TRỊ LIỆU
GEN TRỊ LIỆU
Carregando em…3
×

Confira estes a seguir

1 de 24 Anúncio

Mais Conteúdo rRelacionado

Semelhante a [hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf (20)

Anúncio

[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf

  1. 1. 426 21.1. C¸c ph−¬ng ph¸p míi ® gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen 21.2. C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng 21.3. C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen 21.4. Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m hãa vµ nhiÒu hä ®a gen 21.5. LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa 21.6. So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn g−êi phô n÷ trªn Hinh 21.1 vµ con tinh tinh bªn c¹nh c« ®ang c−êi ®ïa víi nhau – cã thËt vËy kh«ng? Hä cã hiÓu nh÷ng “c©u ®ïa giìn” vµ ®¸p l¹i b»ng vÎ mÆt cïng víi c¸c tiÕng ph¸t ©m cña nhau kh«ng? Nhê nh÷ng kü thuËt ®−îc ph¸t triÓn gÇn ®©y trong viÖc gi¶i tr×nh tù nhanh toµn bé c¸c hÖ gen, giê ®©y chóng ta cã thÓ tuyªn bè vÒ c¬ së di truyÒn liªn quan ®Õn c¸c c©u hái hÊp dÉn nh− võa ®−îc nªu. Tinh tinh (Pan troglodytes) lµ loµi cã quan hÖ sèng gÇn chóng ta nhÊt trªn c©y tiÕn hãa cña sù sèng. HÖ gen cña nã ®−îc gi¶i tr×nh tù hoµn toµn vµo n¨m 2005, nghÜa lµ kho¶ng 2 n¨m sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi hoµn thµnh phÇn lín. Giê ®©y chóng ta ®· cã thÓ so s¸nh hÖ gen cña chóng ta víi hÖ gen cña tinh tinh vµ ®èi chiÕu tõng baz¬ nit¬ nh»m lµm s¸ng tá nh÷ng th«ng tin di truyÒn kh¸c nhau nµo ®· dÉn ®Õn c¸c ®Æc ®iÓm kh¸c biÖt gi÷a hai loµi linh tr−ëng nµy. Ngoµi viÖc ®· x¸c ®Þnh ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña ng−êi vµ tinh tinh, c¸c nhµ nghiªn cøu còng ®· thu ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña vi khuÈn E. coli vµ nhiÒu loµi sinh vËt nh©n s¬ kh¸c, còng nh− cña mét sè loµi sinh vËt nh©n thËt, bao gåm Saccharomyces ceriviseae (nÊm men bia), Caenorhabitis elegans (mét loµi giun trßn), Drosophila melanogaster (ruåi giÊm), Mus musculus (chuét b¹ch) vµ Macaca mulatta (khØ rhezut). ThËm chÝ c¸c ph©n ®o¹n ADN tõ c¸c loµi ®· bÞ tuyÖt chñng, nh− gÊu hang (Ursus spelaneus) hay voi mamót l«ng (Mammuthus primigenius) còng ®· ®−îc gi¶i tr×nh tù. C¸c tr×nh tù hÖ gen ®Çy ®ñ hoÆc tõng phÇn b¶n th©n chóng lµ ®èi t−îng ®−îc quan t©m nghiªn cøu, ®ång thêi chóng cung cÊp nh÷ng th«ng tin s©u h¬n vÒ tiÕn hãa vµ nhiÒu qu¸ tr×nh sinh häc kh¸c. B»ng viÖc më réng so s¸nh hÖ gen ng−êi vµ tinh tinh víi c¸c loµi linh tr−ëng kh¸c còng nh− víi c¸c loµi ®éng vËt cã quan hÖ di truyÒn xa h¬n, chóng ta cã thÓ t×m thÊy tËp hîp c¸c gen quy ®Þnh sù kh¸c biÖt râ rÖt cña mçi nhãm sinh vËt. Xa h¬n mét chót, sù so s¸nh víi c¸c hÖ gen vi khuÈn, vi khuÈn cæ (archaea), nguyªn sinh ®éng vËt vµ c¸c loµi thùc vËt sÏ gióp chóng ta lµm s¸ng tá lÞch sö tiÕn hãa l©u dµi liªn quan ®Õn c¸c gen ®−îc c¸c loµi cïng nhau “chia sΔ cïng víi c¸c s¶n phÈm cña chóng. Víi viÖc hÖ gen cña nhiÒu loµi ®· ®−îc gi¶i tr×nh tù ®Çy ®ñ, c¸c nhµ khoa häc cã thÓ nghiªn cøu c¸c tËp hîp gen hoµn chØnh vµ sù t−¬ng t¸c cña chóng theo mét h−íng nghiªn cøu ®−îc gäi lµ hÖ gen häc (genomics). C¸c nç lùc gi¶i tr×nh tù theo h−íng nghiªn cøu nµy ®· vµ ®ang tiÕp tôc t¹o ra nh÷ng khèi d÷ liÖu khæng lå. Nhu cÇu cÇn xö lý mét l−îng th«ng tin trµn ngËp ®ang t¨ng lªn nhanh chãng ®· dÉn ®Õn sù h×nh thµnh cña lÜnh vùc tin sinh häc (bioinformatics), lÜnh vùc øng dông c¸c ph−¬ng ph¸p khoa häc m¸y tÝnh vµo viÖc l−u gi÷ vµ ph©n tÝch c¸c sè liÖu sinh häc. Chóng ta sÏ b¾t ®Çu ch−¬ng nµy b»ng viÖc th¶o luËn vÒ hai h−íng nghiªn cøu, gåm c¸c kü thuËt gi¶i tr×nh tù hÖ gen vµ mét sè tiÕn bé trong viÖc øng dông tin sinh häc. Sau ®ã chóng ta sÏ s¬ l−îc vÒ nh÷ng hiÓu biÕt thu nhËn ®−îc tõ viÖc gi¶i tr×nh tù c¸c hÖ gen ®· ®−îc tiÕn hµnh ®Õn nay. Sau ®ã chóng ta sÏ m« t¶ vÒ thµnh phÇn hÖ gen ng−êi nh− mét hÖ gen ®¹i diÖn cho c¸c sinh vËt nh©n thËt ®a bµo. Cuèi cïng, chóng ta sÏ cïng t×m hiÓu nh÷ng quan ®iÓm vÒ qu¸ tr×nh tiÕn hãa vµ c¸c c¬ chÕ ph¸t triÓn vèn lµ c¬ së t¹o nªn sù ®a d¹ng vÜ ®¹i cña sù sèng hiÖn cã trªn Tr¸i §Êt. N C¸c kh¸i niÖm chÝnh Tæng quan §äc c¸c l¸ trªn c©y sù sèng H×nh 21.1 Th«ng tin nµo trong hÖ gen ®· t¹o nªn con ng−êi vµ tinh tinh ? C¸c hÖ gen vµ sù tiÕn hãa cña chóng
  2. 2. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 427 ViÖc gi¶i tr×nh tù hÖ gen ng−êi, mét dù ¸n tham väng víi tªn gäi Dù ¸n HÖ gen Ng−êi (HGP) ®−îc b¾t ®Çu vµo n¨m 1990. §−îc tæ chøc thµnh mét Tæ hîp (conxoocxi«m) gåm nhiÒu nhµ khoa häc quèc tÕ ®−îc céng ®ång tµi trî, dù ¸n ®· ®−îc triÓn khai ë 20 trung t©m gi¶i tr×nh tù lín thuéc 6 quèc gia bªn c¹nh nhiÒu phßng thÝ nghiÖm nhá thùc hiÖn c¸c nh¸nh cña dù ¸n. Sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®−îc hoµn thµnh phÇn lín vµo n¨m 2003, tr×nh tù cña mçi nhiÔm s¾c thÓ ®· ®−îc ph©n tÝch kü l−ìng vµ ®−îc m« t¶ trong hµng lo¹t c¸c bµi b¸o khoa häc, trong ®ã bµi b¸o cuèi cïng liªn quan ®Õn tr×nh tù cña nhiÔm s¾c thÓ sè 1 ®−îc c«ng bè vµo n¨m 2006. Víi kÕt qu¶ nµy, c¸c nhµ nghiªn cøu coi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®· “chÝnh thøc hoµn thµnh”. §Ó ®¹t ®−îc nh÷ng cét mèc ®ã, dù ¸n ®· ®−îc triÓn khai qua ba giai ®o¹n víi c¸c ph¸t hiÖn ngµy cµng chi tiÕt h¬n vÒ hÖ gen ng−êi; ba giai ®o¹n ®ã gåm: lËp b¶n ®å liªn kÕt, lËp b¶n ®å vËt lý vµ gi¶i tr×nh tù ADN. Gi¶i tr×nh tù hÖ gen qua ba giai ®o¹n Tr−íc khi Dù ¸n HÖ gen Ng−êi b¾t ®Çu, c¸c nghiªn cøu tr−íc ®ã ®· ph¸c th¶o ®−îc mét b−íc tranh s¬ bé vÒ tæ chøc hÖ gen cña nhiÒu c¬ thÓ sinh vËt kh¸c nhau. VÝ dô nh−, viÖc ph©n tÝch kiÓu h×nh nhiÔm s¾c thÓ cña nhiÒu loµi ®· cho biÕt sè l−îng nhiÔm s¾c thÓ vµ kiÓu h×nh nhuém b¨ng cña chóng (xem H×nh 13.3). Vµ ®èi víi mét sè gen, vÞ trÝ cña chóng trªn nhiÔm s¾c thÓ ®· ®−îc x¸c ®Þnh bëi ph−¬ng ph¸p lai huúnh quang t¹i chç (FISH), ph−¬ng ph¸p mµ trong ®ã ng−êi ta ®em lai c¸c mÉu dß ph¸t huúnh quang víi c¸c nhiÔm s¾c thÓ nguyªn vÑn ®−îc cè ®Þnh (xem H×nh 15.1). B¶n ®å di truyÒn tÕ bµo ®−îc x©y dùng theo c¸ch nµy ®· cung cÊp nh÷ng th«ng tin khëi ®Çu cho viÖc lËp b¶n ®å chi tiÕt h¬n sau nµy. Khi ®· cã trong tay b¶n ®å di truyÒn tÕ bµo cña c¸c nhiÔm s¾c thÓ, giai ®o¹n ®Çu tiªn cña tiÕn tr×nh gi¶i tr×nh tù hÖ gen ng−êi lµ x©y dùng mét b¶n ®å liªn kÕt (mét lo¹i b¶n ®å di truyÒn; xem Ch−¬ng 15) cña kho¶ng vµi ngh×n dÊu chuÈn di truyÒn ®−îc ph©n bè kh¾p c¸c nhiÔm s¾c thÓ (Hinh 21.2 giai ®o¹n ). TrËt tù vÞ trÝ cña c¸c dÊu chuÈn vµ kho¶ng c¸ch gi÷a chóng trªn b¶n ®å ®−îc x¸c ®Þnh trªn c¬ së tÇn sè t¸i tæ hîp (xem H×nh 15.11). C¸c dÊu chuÈn di truyÒn cã thÓ lµ c¸c gen hoÆc lµ c¸c ®o¹n tr×nh tù ADN kh¸c cã thÓ x¸c ®Þnh ®−îc, ch¼ng h¹n nh− c¸c RFLP hay c¸c tr×nh tù lÆp l¹i kÕ tiÕp ng¾n (STR) ®· ®−îc ®Ò cËp ë Ch−¬ng 20. TÝnh ®Õn n¨m 1992, c¸c nhµ nghiªn cøu ®· tËp hîp ®−îc mét b¶n ®å liªn kÕt ë ng−êi gåm kho¶ng 5000 dÊu chuÈn kh¸c nhau. Mét b¶n ®å nh− vËy ®· gióp hä x¸c ®Þnh ®−îc vÞ trÝ cña c¸c dÊu chuÈn kh¸c, bao gåm c¶ c¸c gen, b»ng viÖc kiÓm tra tÝnh liªn kÕt di truyÒn cña chóng víi c¸c dÊu chuÈn ®· biÕt tr−íc ®ã. Ngoµi ra, nã cßn cã gi¸ trÞ lµ phÇn cèt lâi cña viÖc lËp b¶n ®å chi tiÕt h¬n t¹i nh÷ng vïng nhÊt ®Þnh trong hÖ gen. Giai ®o¹n tiÕp theo lµ viÖc lËp b¶n ®å vËt lý hÖ gen ng−êi. Trong b¶n ®å vËt lý, kho¶ng c¸ch gi÷a c¸c dÊu chuÈn ®−îc biÓu diÔn bëi ®¬n vÞ vËt lý, th−êng lµ sè cÆp baz¬ nit¬ (bp) däc theo ph©n tö ADN. §Ó lËp mét b¶n ®å hÖ gen hoµn chØnh, mét b¶n ®å vËt lý ®−îc thiÕt lËp b»ng c¸ch c¾t ph©n tö ADN t−¬ng øng víi mét nhiÔm s¾c thÓ thµnh mét sè c¸c ph©n ®o¹n giíi h¹n råi x¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n trªn ph©n tö ADN nhiÔm s¾c thÓ gèc. Ch×a khãa ®Ó thùc hiÖn ®iÒu nµy lµ cÇn t¹o ra c¸c ph©n ®o¹n ADN gèi lªn nhau, råi sö dông c¸c mÉu dß hoÆc ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng c¸c tr×nh tù ®Çu cuèi cña nh÷ng ph©n ®o¹n nµy ®Ó t×m ra c¸c tr×nh tù gèi lªn nhau ®ã (H×nh 21.2, giai ®o¹n ). B»ng c¸ch ®ã, cã thÓ ®Æt c¸c ph©n ®o¹n vµo ®óng trËt tù t−¬ng øng cña chóng trªn nhiÔm s¾c thÓ. Nguån cung cÊp c¸c ph©n ®o¹n ADN dïng cho viÖc lËp b¶n ®å vËt lý dùa trªn viÖc nh©n dßng ADN. §Ó gi¶i tr×nh tù c¸c hÖ gen lín, c¸c nhµ khoa häc ph¶i thùc hiÖn lÆp l¹i nhiÒu lÇn c¸c c«ng viÖc c¾t ADN, nh©n dßng vµ lËp b¶n ®å vËt lý. C¸c vect¬ nh©n dßng ®Çu tiªn th−êng ®−îc sö dông lµ nhiÔm s¾c thÓ nh©n t¹o nÊm men (YAC) cho phÐp mang nh÷ng ®o¹n ADN cµi dµi ®Õn hµng triÖu bp, hoÆc nhiÔm s¾c thÓ nh©n t¹o vi khuÈn (BAC) vèn ®iÓn h×nh cã thÓ mang c¸c ®o¹n cµi dµi tõ 100.000 ®Õn 300.000 bp. Sau khi nh÷ng ®o¹n ADN dµi nh− vËy ®· ®−îc x¸c ®Þnh trËt tù trªn nhiÔm s¾c thÓ chÝnh x¸c, chóng sÏ ®−îc c¾t thµnh nh÷ng ph©n ®o¹n nhá h¬n, råi ®−îc nh©n dßng vµo c¸c 21.1 Kh¸i niÖm C¸c ph−¬ng ph¸p míi ® gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen H×nh 21.2 Ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen qua ba giai ®o¹n. B¾t ®Çu tõ mét b¶n ®å di truyÒn tÕ bµo cña mçi nhiÔm s¾c thÓ, c¸c nhµ nghiªn cøu liªn quan ®Õn Dù ¸n HÖ gen Ng−êi ®· tiÕn hµnh c¸c nghiªn cøu qua ba giai ®o¹n ®Ó ®¹t ®−îc môc tiªu cuèi cïng, ®ã lµ gi¶i tr×nh tù toµn bé tõng nucleotide trªn mçi nhiÔm s¾c thÓ. B¶n ®å di truyÒn tÕ bµo KiÓu h×nh nhuém b¨ng cña nhiÔm s¾c thÓ vµ vÞ trÝ c¸c gen ®Æc thï ®−îc x¸c ®Þnh b»ng ph−¬ng ph¸p lai insitu (FISH) VÞ trÝ gen ®−îc x¸c ®Þnh b»ng FISH C¸c b¨ng nhiÔm s¾c thÓ sau khi ®−îc nhuém B¶n ®å liªn kÕt X¸c ®Þnh trËt tù cña c¸c dÊu chuÈn di truyÒn nh− RFLP, STR vµ c¸c ®a h×nh di truyÒn kh¸c (kho¶ng 200 dÊu chuÈn trªn mçi nhiÔm s¾c thÓ) B¶n ®å vËt lý X¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n lín gèi lªn nhau ®−îc nh©n dßng bëi c¸c vect¬ YAC vµ BAC; sau ®ã lµ trËt tù cña c¸c ®o¹n ng¾n h¬n ®−îc nh©n dßng bëi c¸c vect¬ plasmid vµ phag¬ Gi¶i tr×nh tù ADN X¸c ®Þnh tr×nh tù cña c¸c nucleotide trªn mçi ®o¹n ng¾n vµ ghÐp nèi c¸c tr×nh tù thµnh phÇn víi nhau thµnh tr×nh tù hÖ gen hoµn chØnh C¸c dÊu chuÈn di truyÒn C¸c ®o¹n gèi lªn nhau
  3. 3. 428 khèi kiÕn thøc 3 Di truyÒn häc vect¬ plasmid hoÆc phag¬, tr−íc khi nh÷ng ph©n ®o¹n nhá nµy ®−îc dïng ®Ó gi¶i tr×nh tù chi tiÕt. Môc tiªu cuèi cïng cña viÖc lËp b¶n ®å mét hÖ gen lµ x¸c ®Þnh ®−îc tr×nh tù nucleotide hoµn chØnh cña mçi nhiÔm s¾c thÓ (H×nh 21.2, giai ®o¹n ). §èi víi hÖ gen ng−êi, giai ®o¹n nµy ®−îc thùc hiÖn nhê c¸c m¸y gi¶i tr×nh tù sö dông ph−¬ng ph¸p kÕt thóc chuçi dideoxy ®−îc m« t¶ trªn H×nh 20.12. Ngay c¶ khi ®· ®−îc tù ®éng hãa, viÖc gi¶i tr×nh tù cña toµn bé 3,2 tØ cÆp baz¬ trong bé nhiÔm s¾c thÓ ®¬n béi cña ng−êi vÉn cßn lµ mét th¸ch thøc khñng khiÕp. Trong thùc tÕ, mét ®ét ph¸ chÝnh cña Dù ¸n HÖ gen Ng−êi lµ sù ph¸t triÓn cña c«ng nghÖ gi¶i tr×nh tù nhanh. Nh÷ng c¶i tiÕn kü thuËt ®−îc tÝch lòy qua nhiÒu n¨m ®· “mµi dòa” tõng b−íc cña qui tr×nh kü thuËt vèn tèn nhiÒu thêi gian, vµ nhê vËy tèc ®é gi¶i tr×nh tù ®· ®−îc gia tèc mét c¸ch Ên t−îng. NÕu nh− mét phßng thÝ nghiÖm hiÖu qu¶ cã thÓ gi¶i tr×nh tù ®−îc 1000 bp mçi ngµy vµo nh÷ng n¨m 1980, th× ®Õn n¨m 2000, mçi trung t©m nghiªn cøu thuéc Dù ¸n HÖ gen Ng−êi cã thÓ gi¶i tr×nh tù 1000 bp mçi gi©y trong suèt 24 giê mçi ngµy vµ 7 ngµy mçi tuÇn. C¸c ph−¬ng ph¸p nh− vËy cã thÓ ph©n tÝch rÊt nhanh c¸c vËt liÖu sinh häc vµ t¹o ra c¸c khèi d÷ liÖu khæng lå trong thêi gian ng¾n vµ ®−îc gäi chung lµ c¸c ph−¬ng ph¸p “hiÖu n¨ng cao”. C¸c m¸y gi¶i tr×nh tù tù ®éng lµ mét vÝ dô vÒ c¸c thiÕt bÞ thÝ nghiÖm hiÖu n¨ng cao. Trong thùc tiÔn, ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2 gèi lªn nhau theo mét c¸ch phøc t¹p h¬n m« h×nh gi¶n l−îc võa ®−îc chóng ta ®Ò cËp; tuy vËy, m« h×nh nµy ph¶n ¸nh ®óng chiÕn l−îc nghiªn cøu tæng thÓ ®−îc dïng trong Dù ¸n HÖ gen Ng−êi. Trong qu¸ tr×nh thùc hiÖn dù ¸n, mét chiÕn l−îc kh¸c nh»m gi¶i tr×nh tù hÖ gen ®· xuÊt hiÖn vµ sau ®ã ®−îc ¸p dông réng r·i nhê hiÖu qu¶ cùc kú cao cña nã. PhÇn tiÕp theo, chóng ta ®Ò cËp ®Õn chiÕn l−îc gi¶i tr×nh tù nµy. Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen N¨m 1992, m¹nh d¹n dùa trªn c¸c thµnh tùu míi cña kü thuËt gi¶i tr×nh tù vµ c«ng nghÖ m¸y tÝnh, J. Craig Venter - mét nhµ sinh häc ph©n tö - ®· ph¸t minh ra mét ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen míi. §−îc ®Æt tªn lµ ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen (hay ph−¬ng ph¸p shotgun), thùc chÊt ph−¬ng ph¸p nµy ®· bá qua c¸c giai ®o¹n lËp b¶n ®å liªn kÕt vµ b¶n ®å vËt lý; thay vµo ®ã, nã b¾t ®Çu ngay b»ng viÖc gi¶i tr×nh tù c¸c ph©n ®o¹n ADN ngÉu nhiªn cña toµn hÖ gen. Sau ®ã, c¸c ch−¬ng tr×nh m¸y tÝnh m¹nh sÏ tiÕn hµnh s¾p xÕp mét sè l−îng lín c¸c ph©n ®o¹n ADN ®· ®−îc gi¶i tr×nh tù, dùa trªn c¸c ®o¹n tr×nh tù ng¾n n»m gèi lªn nhau cña chóng, thµnh mét tr×nh tù liªn tôc duy nhÊt (Hinh 21.3). MÆc dï ban ®Çu bÞ hoµi nghi bëi nhiÒu nhµ khoa häc, gi¸ trÞ cña ph−¬ng ph¸p Vender trë nªn râ rµng vµo n¨m 1995 khi «ng vµ céng sù c«ng bè hÖ gen cña mét loµi sinh vËt ®−îc gi¶i tr×nh tù hoµn chØnh ®Çu tiªn, ®ã lµ vi khuÈn g©y bÖnh tiªu ch¶y Haemophilus influenza. N¨m 1998, Venter thµnh lËp mét c«ng ty cã tªn lµ Celera Genomics vµ tuyªn bè dù ®Þnh gi¶i tr×nh tù toµn bé hÖ gen ng−êi cña m×nh. N¨m n¨m sau, Cerela Genomics vµ Tæ hîp HGP ®ång thêi th«ng b¸o viÖc gi¶i tr×nh tù hÖ gen ng−êi ®· hoµn thµnh phÇn lín, nghÜa lµ sím h¬n hai n¨m so víi tiÕn ®é dù kiÕn ban ®Çu cña Dù ¸n HÖ gen Ng−êi. C¸c ®¹i diÖn cña Tæ hîp HGP chØ ra r»ng viÖc hoµn thµnh gi¶i tr×nh tù hÖ gen ng−êi cña Celera ph¶i dùa nhiÒu vµo c¸c b¶n ®å di truyÒn vµ sè liÖu tr×nh tù cña hä, còng nh− c¸c trang thiÕt bÞ mµ hä thiÕt lËp cho dù ¸n ®· hç trî nhiÒu cho c¸c nç lùc cña Celera. Ng−îc l¹i, Venter còng ®· dïng lý lÏ ®Ó biÖn hé cho hiÖu qu¶ vµ gi¸ thµnh h¹ trong ph−¬ng ph¸p gi¶i tr×nh tù cña Celera, ®ång thêi chØ ra r»ng Tæ hîp HGP còng ®· sö dông c¸c sè liÖu cña hä. Râ rµng c¶ hai ph−¬ng ph¸p ®Òu cã gi¸ trÞ vµ cïng ®ãng gãp vµo viÖc nhanh chãng hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen cña mét sè loµi. HiÖn nay ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen ®ang ®−îc dïng réng r·i. Theo mét c¸ch ®iÓn h×nh, c¸c ph©n ®o¹n ADN ®−îc nh©n dßng b»ng ba lo¹i vect¬ kh¸c nhau, mçi lo¹i ®−îc cµi mét ph©n ®o¹n x¸c ®Þnh. Kho¶ng c¸ch ®· biÕt gi÷a c¸c ®Çu cña ph©n ®o¹n ADN cµi lµ mét th«ng tin bæ sung gióp m¸y tÝnh cã thÓ s¾p xÕp ®óng c¸c tr×nh tù. Mét nghiªn cøu gÇn ®©y so s¸nh hai chiÕn l−îc gi¶i tr×nh tù ®· chØ ra r»ng ph−¬ng ph¸p shotgun cã thÓ m¾c lçi bá qua mét sè tr×nh tù lÆp l¹i, v× vËy cã thÓ ph¶n ¸nh kh«ng chÝnh x¸c kÝnh th−íc thùc cña hÖ gen vµ cã thÓ bá qua mét sè gen trong nh÷ng vïng nh− vËy trªn nhiÔm s¾c thÓ. C¸c ph−¬ng ph¸p phèi hîp cuèi cïng ®· ®−îc ¸p dông cho hÖ gen ng−êi; trong ®ã ph−¬ng ph¸p shotgun cã tèc ®é nhanh ®−îc hç trî bëi b¶n ®å di truyÒn cña c¸c dßng gen cã lÏ lµ c¸ch h÷u hiÖu nhÊt cho nh÷ng øng dông l©u dµi. §Õn n¨m 2007, vÉn cßn mét phÇn nhá cña hÖ gen ng−êi ch−a ®−îc gi¶i tr×nh tù. Do sù cã mÆt cña tr×nh tù ADN lÆp l¹i vµ bëi mét sè nguyªn nh©n ch−a biÕt kh¸c, mét sè phÇn nhÊt C¾t ADN tõ nhiÒu b¶n sao cña mét nhiÔm s¾c thÓ thµnh c¸c ph©n ®o¹n gèi lªn nhau cã chiÒu dµi ®ñ ng¾n ®Ó cã thÓ gi¶i tr×nh tù. Nh©n dßng mçi ph©n ®o¹n trong c¸c vect¬ plasmid hoÆc phag¬ (xem c¸c H×nh 20.4 vµ 20.5) Gi¶i tr×nh tù tõng ph©n ®o¹n (xem H×nh 20.12) Sö dông phÇn mÒm m¸y tÝnh s¾p xÕp c¸c ph©n ®o¹n theo ®óng trËt tù vÞ trÝ cña chóng H×nh 21.3 Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen. Theo ph−¬ng ph¸p nµy, ®−îc ph¸t triÓn bëi Craig Venter vµ c¸c ®ång nghiÖp t¹i C«ng ty Celera Genomics do chÝnh «ng s¸ng lËp, c¸c ®o¹n ADN ®−îc gi¶i tr×nh tù ngÉu nhiªn, råi sau ®ã chóng ®−îc s¾p xÕp theo ®óng trËt tù vÞ trÝ t−¬ng ®èi víi nhau. H·y so s¸nh ph−¬ng ph¸p nµy víi ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen qua ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2. C¸c ph©n ®o¹n ë giai ®o¹n 2 trªn h×nh nµy ®−îc vÏ n»m r¶i r¸c, trong khi nh÷ng ph©n ®o¹n ë giai ®o¹n 2 trªn H×nh 21.2 ®−îc vÏ n»m theo trËt tù vÞ trÝ. Sù kh¸c biÖt trong c¸ch vÏ nh− vËy ph¶n ¸nh sù kh¸c biÖt gi÷a hai ph−¬ng ph¸p nh− thÕ nµo?.
  4. 4. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 429 ®Þnh trªn nhiÔm s¾c thÓ cña c¸c c¬ thÓ ®a bµo rÊt khã gi¶i tr×nh tù chi tiÕt bëi c¸c ph−¬ng ph¸p th«ng th−êng. Tho¹t nh×n th× d−êng nh− tr×nh tù hÖ gen cña ng−êi vµ c¸c sinh vËt kh¸c ®¬n gi¶n chØ lµ nh÷ng tr×nh tù “kh« khèc” cña c¸c nucleotide, nghÜa lµ hµng triÖu c¸c “ch÷ c¸i” A, T, G vµ C s¾p xÕp kÕ tiÕp nhau mét c¸ch “buån ch¸n”. §iÒu cèt yÕu ®Ó l−îng d÷ liÖu khæng lå nµy trë nªn cã nghÜa lµ c¸c ph−¬ng ph¸p ph©n tÝch mµ chóng ta sÏ ®Ò cËp ®Õn ë tiÓu môc tiÕp theo. Mçi mét trung t©m trong sè kho¶ng 20 trung t©m gi¶i tr×nh tù tham gia dù ¸n HÖ gen Ng−êi ngµy nµy qua ngµy kh¸c ®· t¹o ra mét l−îng khæng lå c¸c tr×nh tù ADN. Khi sè liÖu ngµy cµng ®−îc tÝch lòy, th× nhu cÇu n¶y sinh lµ ph¶i cã c¸ch qu¶n lý vµ theo dâi tÊt c¶ c¸c tr×nh tù ®· ®−îc ph¸t hiÖn. Nhê ®· chuÈn bÞ tõ tr−íc, c¸c nhµ khoa häc vµ c¸c c¬ quan qu¶n lý tham gia Dù ¸n HÖ gen Ng−êi ®· ®Æt ra mét môc tiªu ngay tõ ®Çu lµ thiÕt lËp c¸c ng©n hµng d÷ liÖu, hay cßn gäi lµ c¬ së d÷ liÖu, vµ ngµy cµng hoµn thiÖn c¸c phÇn mÒm ph©n tÝch d÷ liÖu. Nh÷ng c¬ së d÷ liÖu vµ nh÷ng phÇn mÒm nµy sau ®ã ®−îc tËp hîp l¹i vµ cã thÓ dÔ dµng truy cËp vµ sö dông trªn m«i tr−êng Internet. ViÖc hoµn thµnh môc tiªu nµy cña dù ¸n ®· gãp phÇn thóc ®Èy viÖc ph©n tÝch c¸c tr×nh tù ADN nhê t¹o ®iÒu kiÖn cho c¸c céng ®ång khoa häc toµn thÕ giíi cã thÓ tiÕp cËn c¸c tµi nguyªn tin sinh häc, còng nh− thóc ®Èy viÖc truyÒn b¸ vµ trao ®æi c¸c th«ng tin cã liªn quan. TËp hîp d÷ liÖu ®Ó ph©n tÝch c¸c hÖ gen C¸c c¬ quan ®−îc chÝnh phñ tµi trî thùc hiÖn vai trß thiÕt lËp c¸c c¬ së d÷ liÖu vµ cung cÊp c¸c ph©n mÒm nhê ®ã c¸c nhµ khoa häc cã thÓ ph©n tÝch c¸c d÷ liÖu tr×nh tù hÖ gen. Ch¼ng h¹n, ë Mü, mét ch−¬ng tr×nh hîp t¸c gi÷a Th− viÖn Y häc Quèc gia vµ ViÖn Y häc Quèc gia (NIH) ®· thiÕt lËp nªn Trung t©m Quèc gia vÒ Th«ng tin C«ng nghÖ Sinh häc (NCBI) ®ång thêi duy tr× mét trang Web (www.ncbi.nlm.nih.gov) l−u gi÷ c¸c tµi nguyªn tin sinh häc hÕt søc phong phó. T¹i trang Web nµy, c¸c ®−êng “link” dÉn ®Õn c¸c c¬ së d÷ liÖu, c¸c phÇn mÒm vµ c¸c kho chøa c¸c th«ng tin vÒ c¸c hÖ gen vµ c¸c chñ ®Ò cã liªn quan kh¸c. C¸c trang Web t−¬ng tù còng ®· ®−îc thiÕt lËp bëi Phßng thÝ nghiÖm Sinh häc ph©n tö Ch©u ¢u vµ Ng©n hµng D÷ liÖu ADN NhËt B¶n; ®©y còng chÝnh lµ hai trung t©m nghiªn cøu hÖ gen cïng hîp t¸c víi NCBI. Nh÷ng trang Web lín vµ toµn diÖn nµy cßn ®−îc bæ sung thªm bëi nh÷ng trang Web kh¸c ®−îc duy tr× bëi c¸c phßng thÝ nghiÖm nhá h¬n hoÆc bëi c¸c c¸ nh©n. C¸c trang Web nhá h¬n th−êng cung cÊp c¸c c¬ së d÷ liÖu vµ c¸c phÇn mÒm ®−îc thiÕt kÕ cho c¸c môc ®Ých nghiªn cøu hÑp h¬n, ch¼ng h¹n nh− ®Ó t×m hiÓu vÒ nh÷ng thay ®æi di truyÒn hoÆc trong hÖ gen liªn quan ®Õn mét bÖnh ung th− nhÊt ®Þnh. C¸c c¬ së d÷ liÖu vÒ c¸c tr×nh tù cña NCBI ®−îc gäi chung lµ Ng©n hµng gen (Genbank). TÝnh tíi th¸ng 8 n¨m 2007, Genbank ®· chøa tr×nh tù cña 76 triÖu ph©n ®o¹n ADN hÖ gen kh¸c nhau, gåm tæng céng 80 tû cÆp baz¬ ! C¸c tr×nh tù trong ng©n hµng gen liªn tôc ®−îc cËp nhËt, vµ −íc tÝnh l−îng d÷ liÖu cña nã cø sau kho¶ng 18 th¸ng l¹i t¨ng lªn gÊp ®«i. Mäi tr×nh tù trong Genbank cã thÓ ®−îc truy xuÊt vµ ph©n tÝch b»ng c¸c ph©n mÒm ë trang Web cña NCBI hoÆc tõ c¸c trang Web kh¸c. Mét ch−¬ng tr×nh phÇn mÒm s½n cã trªn trang Web cña NCBI, gäi lµ BLAST, cho phÐp bÊt cø ai truy cËp cã thÓ so s¸nh ®−îc mét tr×nh tù ADN nhÊt ®Þnh víi bÊt cø tr×nh tù nµo s½n cã trong Genbank trªn c¬ së ®èi chiÕu tõng cÆp baz¬, qua ®ã t×m thÊy c¸c vïng tr×nh tù gièng nhau gi÷a chóng. Mét phÇn mÒm kh¸c cho phÐp so s¸nh c¸c tr×nh tù protein dù ®o¸n. Ngoµi ra, mét phÇn mÒm thø ba cho phÐp t×m kiÕm mét chuçi axit amin (miÒn) cã chøc n¨ng sinh häc ®· biÕt hoÆc ®ang ®−îc dù ®o¸n tõ mäi tr×nh tù protein s½n cã trong Genbank; ®ång thêi, nã cã thÓ biÓu diÔn m« h×nh kh«ng gian ba chiÒu cña miÒn chøc n¨ng ®ã cïng víi c¸c th«ng tin cã liªn quan phï hîp (xem H×nh 21.4 ë trang sau). ThËm chÝ cßn cã mét ch−¬ng tr×nh phÇn mÒm cã thÓ so s¸nh mét tËp hîp c¸c tr×nh tù, hoÆc lµ c¸c tr×nh tù axit nucleic hoÆc lµ c¸c tr×nh tù polypeptit, vµ biÓu diÔn chóng ë d¹ng c©y tiÕn hãa trªn c¬ së mèi quan hÖ gi÷a c¸c tr×nh tù. (Chóng ta sÏ ®Ò cËp kü h¬n vÒ nh÷ng s¬ ®å nµy ë Ch−¬ng 26). Trang Web cña NCBI còng cßn duy tr× mét c¬ së d÷ liÖu bao gåm tÊt c¶ c¸c cÊu tróc ba chiÒu cña protein ®· ®−îc x¸c ®Þnh (®Ó tæng quan vÒ ph©n tÝch cÊu tróc protein, xem H×nh 5.25). B»ng phÇn mÒm m¸y tÝnh, ng−êi xem cã thÓ quay nh÷ng cÊu tróc nµy ®Ó cã thÓ quan s¸t protein tõ mäi phÝa. Gi¶ sö mét nhµ nghiªn cøu cã mét tr×nh tù axit amin lµ tr×nh tù ®Çy ®ñ hoÆc mét phÇn cña mét protein ch−a biÕt nµo ®ã, mµ nã l¹i cã tr×nh tù gièng víi mét tr×nh tù axit amin cã cÊu tróc kh«ng gian ®· biÕt. Trong tr−êng hîp nµy, nhµ nghiªn cøu cã thÓ dù ®o¸n cÊu tróc cña protein ch−a biÕt b»ng mét phÇn mÒm, vµ sö dông mét phÇn mÒm kh¸c ®Ó so s¸nh nã víi tÊt c¶ c¸c cÊu tróc protein ®· biÕt. Nh÷ng th«ng tin nµy cã thÓ gióp nhµ nghiªn cøu x¸c ®Þnh ®−îc chøc n¨ng cña protein ch−a biÕt. HiÖn nay, trªn toµn thÕ giíi cã rÊt nhiÒu nguån tµi nguyªn s½n cã cho c¸c nhµ nghiªn cøu sö dông. B©y giê chóng ta sÏ nãi ®Õn c¸c chñ ®Ò mµ nh÷ng nguån tµi nguyªn nµy ®Ò cËp ®Õn. X¸c ®Þnh c¸c gen m hãa protein trong c¸c tr×nh tù ADN B»ng viÖc sö dông c¸c tr×nh tù ADN s½n cã, c¸c nhµ di truyÒn häc cã thÓ nghiªn cøu trùc tiÕp c¸c gen mµ kh«ng nhÊt thiÕt ph¶i pháng ®o¸n vÒ kiÓu gen trªn c¬ së ph©n tÝch kiÓu h×nh nh− trong c¸c nghiªn cøu di truyÒn häc kinh ®iÓn tr−íc ®©y. Tuy vËy, c¸ch tiÕp cËn nµy l¹i cã mét trë ng¹i kh¸c: ®ã lµ viÖc x¸c ®Þnh kiÓu h×nh trªn c¬ së kiÓu gen ®· biÕt. Trªn c¬ së mét tr×nh 21.2 Kh¸i niÖm C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng 21.1 1. B¶n ®å liªn kÕt vµ b¶n ®å vËt lý cña mét nhiÔm s¾c thÓ kh¸c nhau c¬ b¶n ë ®Æc ®iÓm g× ? 2. XÐt tæng thÓ, ph−¬ng ph¸p lËp b¶n ®å hÖ gen ®−îc dïng trong Dù ¸n HÖ gen Ng−êi vµ ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen kh¸c nhau nh− thÕ nµo ? 3. Gi¶ sö b¹n quyÕt ®Þnh tiÕn hµnh gi¶i tr×nh tù hÖ gen cña mét loµi chuét ®ång, vèn lµ mét loµi cã quan hÖ gÇn gòi víi loµi chuét thÝ nghiÖm cã tr×nh tù hÖ gen ®· ®−îc x¸c ®Þnh hoµn toµn. T¹i sao tr×nh tù hÖ gen chuét thÝ nghiÖm ®· biÕt ®−a b¹n ®Õn quyÕt ®Þnh chän ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen thay cho ph−¬ng ph¸p ba giai ®o¹n ? Xem gîi ý tr¶ lêi ë Phô lôc A. KiÓm tra kh¸i niÖm ®iÒu g× NÕu
  5. 5. 430 khèi kiÕn thøc 3 Di truyÒn häc tù ADN dµi cã trªn c¬ së d÷ liÖu nh− Genbank, b»ng c¸ch nµo chóng ta cã thÓ nhËn ra c¸c gen m· hãa protein vèn ch−a tõng ®−îc biÕt tíi vµ x¸c ®Þnh chøc n¨ng cña chóng? C¸ch th«ng th−êng lµ sö dông mét phÇn mÒm ®Ó t×m kiÕm trong nh÷ng tr×nh tù nµy sù cã mÆt hay kh«ng cña c¸c tÝn hiÖu khëi ®Çu vµ kÕt thóc phiªn m· hoÆc dÞch m·, hoÆc lµ c¸c vÞ trÝ c¾t - nèi ARN hay c¸c tÝn hiÖu kh¸c th−êng cã ë c¸c gen m· hãa protein. PhÇn mÒm nµy ®ång thêi còng t×m kiÕm c¸c ®o¹n tr×nh tù ng¾n t−¬ng øng víi c¸c tr×nh tù th−êng cã trªn c¸c ph©n tö mARN ®· biÕt. Hµng ngh×n c¸c tr×nh tù nh− vËy, ®−îc gäi lµ c¸c ®o¹n ®¸nh dÊu tr×nh tù biÓu hiÖn hay EST ®−îc thu thËp tõ c¸c tr×nh tù cADN vµ ®−îc m¸y tÝnh tËp hîp l¹i thµnh c¸c c¬ së d÷ liÖu. KiÓu ph©n tÝch nµy cho phÐp x¸c ®Þnh ®−îc c¸c tr×nh tù t−¬ng øng víi c¸c gen m· hãa protein mµ tr−íc ®ã ch−a tõng ®−îc biÕt tíi. Kho¶ng mét nöa sè gen ë ng−êi ®· ®−îc biÕt tõ tr−íc khi dù ¸n hÖ gen ng−êi b¾t ®Çu. VËy ®èi víi nh÷ng gen cßn l¹i, viÖc ph©n tÝch c¸c tr×nh tù ADN b»ng c¸ch nµo cho biÕt chóng lµ c¸c gen ch−a ®−îc biÕt tr−íc ®ã? Manh mèi ®Ó x¸c ®Þnh nh÷ng gen nµy xuÊt ph¸t tõ viÖc so s¸nh tr×nh tù cña c¸c “gen øng cö viªn” (c¸c tr×nh tù ®−îc dù ®o¸n lµ gen) víi tr×nh tù cña c¸c gen ®· biÕt cã nguån gèc tõ c¸c sinh vËt kh¸c b»ng viÖc sö dông c¸c phÇn mÒm ®· ®−îc nh¾c ®Õn ë trªn. Do tÝnh tho¸i hãa cña m· di truyÒn, b¶n th©n tr×nh tù ADN cã thÓ cã møc ®é biÕn ®æi lín h¬n so víi c¸c tr×nh tù protein t−¬ng øng. V× vËy, víi c¸c nhµ khoa häc quan t©m ®Õn protein, hä th−êng tiÕn hµnh so s¸nh gi÷a tr×nh tù axit amin cña protein pháng ®o¸n víi c¸c tr×nh tù cña c¸c protein ®· biÕt. §«i khi mét tr×nh tù võa míi ®−îc x¸c ®Þnh khíp hoµn toµn hay mét phÇn víi tr×nh tù cña mét gen hoÆc mét protein mµ chøc n¨ng ®· biÕt râ. VÝ dô nh−, mét phÇn cña mét gen míi cã thÓ khíp víi mét gen ®· biÕt m· hãa cho mét protein kinase, mét protein quan träng tham gia vµo mét con ®−êng truyÒn tÝn hiÖu (xem Ch−¬ng 11), chØ ra nhiÒu kh¶ n¨ng gen míi nµy cã thÓ cã chøc n¨ng t−¬ng tù. Theo mét c¸ch kh¸c, tr×nh tù cña mét gen míi l¹i gièng víi mét tr×nh tù ®· tõng ®−îc biÕt tõ tr−íc nh−ng ch−a râ chøc n¨ng. Mét kh¶ n¨ng kh¸c lµ tr×nh tù míi ®−îc x¸c ®Þnh kh«ng gièng víi bÊt cø mét tr×nh tù nµo ®· tõng ®−îc biÕt ®Õn. §iÒu nµy lµ ®óng ®èi víi Ýt nhÊt mét phÇn ba c¸c gen cña E. coli khi hÖ gen cña vi khuÈn nµy ®−îc gi¶i tr×nh tù. Trong tr−êng hîp cuèi cïng, chøc n¨ng cña protein th−êng ®−îc suy diÔn b»ng viÖc kÕt hîp gi÷a c¸c nghiªn cøu vÒ chøc n¨ng ph©n tö vµ hãa sinh häc. C¸c nghiªn cøu vÒ hãa sinh nh»m x¸c ®Þnh cÊu tróc kh«ng gian ba chiÒu còng nh− c¸c thuéc tÝnh hãa lý cña protein, ch¼ng h¹n nh− c¸c vÞ trÝ liªn kÕt cña protein víi c¸c ph©n tö kh¸c. Trong khi ®ã, c¸c nghiªn cøu vÒ chøc n¨ng ph©n tö th−êng tiÕn hµnh lµm bÊt ho¹t hoÆc lµm gi¶m møc ®é biÓu hiÖn cña c¸c gen míi x¸c ®Þnh råi theo dâi H×nh 21.4 C¸c c«ng cô tin sinh häc s½n cã trªn internet. Mét trang web ®−îc Trung t©m Quèc gia Th«ng tin vÒ C«ng nghÖ Sinh häc (Mü) duy tr× cho phÐp c¸c nhµ khoa häc vµ céng ®ång tiÕp cËn c¸c tr×nh tù protein vµ ADN. Trang web nµy gåm c¶ kÕt nèi tíi mét c¬ së d÷ liÖu cÊu tróc protein - CDD (Conserved Domain Database) gióp t×m vµ m« t¶ nh÷ng miÒn gièng nhau ë c¸c protein cã quan hÖ víi nhau, còng nh− c¸c phÇn mÒm quan s¸t ba chiÒu - Cn3D - cho phÐp quan s¸t m« h×nh ba chiÒu cña c¸c miÒn cÊu tróc ®· ®−îc x¸c ®Þnh. H×nh ¶nh ®−îc minh häa ë trªn lµ kÕt qu¶ t×m kiÕm c¸c vïng protein gièng víi mét tr×nh tù axit amin t×m thÊy ë mét protein cña d−a hÊu. Trong cöa sæ nµy, mét phÇn tr×nh tù axit amin tõ mét protein ch−a biÕt (Query) ë d−a hÊu ®−îc xÕp th¼ng hµng víi c¸c tr×nh tù cña c¸c protein kh¸c mµ ch−¬ng tr×nh m¸y tÝnh t×m thÊy gièng víi nã. C¸c tr×nh tù ë ®©y biÓu diÔn mét miÒn ®−îc gäi lµ WD40. Bèn dÊu hiÖu ®iÓn h×nh cña miÒn nµy ®−îc nhÊn m¹nh b»ng nÒn mµu vµng. (Sù gièng nhau gi÷a c¸c tr×nh tù ®−îc nhËn biÕt chñ yÕu dùa trªn c¸c ®Æc ®iÓm hãa häc cña c¸c axit amin, v× vËy c¸c axit amin ë c¸c vïng ®−îc nhÊn m¹nh kh«ng nhÊt thiÕt gièng nhau hoµn toµn.) Ch−¬ng tr×nh Cn3D hiÓn thÞ mét m« h×nh ruy b¨ng ba chiÒu cña protein transductin cña bß (protein ®−îc t« b»ng nÒn mµu tÝm nh¹t trong cöa sæ Sequence Aligment Viewer). Protein nµy lµ lo¹i duy nhÊt trong c¸c protein tr×nh diÖn ë ®©y cã cÊu tróc ®· ®−îc x¸c ®Þnh. Sù gièng víi transductin bß cña c¸c protein kh¸c cho thÊy cÊu tróc cña chóng cã thÓ gièng víi m« h×nh ®−îc hiÓn thÞ ë ®©y. Transductin bß chøa b¶y miÒn WD40; mét trong nh÷ng miÒn nµy ®−îc nhÊn m¹nh b»ng mµu ghi. C¸c vïng ®−îc t« mµu vµng nµy t−¬ng øng víi c¸c axit amin dÊu hiÖu ®iÓn h×nh ®−îc t« mµu vµng ë cöa sæ bªn trªn. Cöa sæ nµy hiÓn thÞ th«ng tin vÒ miÒn WD40 tõ C¬ së d÷ liÖu cÊu tróc protein – CDD.
  6. 6. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 431 sù thay ®æi cña kiÓu h×nh, qua ®ã x¸c ®Þnh chøc n¨ng cña gen. ARNi, ®−îc m« t¶ ë Ch−¬ng 20, lµ mét vÝ dô vÒ kü thuËt phßng thÝ nghiÖm ®−îc dïng ®Ó bÊt ho¹t chøc n¨ng cña gen. T×m hiÓu c¸c gen vµ c¸c s¶n phÈm cña gen ë cÊp ®é sinh häc hÖ thèng Søc m¹nh ®Çy Ên t−îng cña c¸c c«ng cô sinh tin häc vµ m¸y tÝnh cho phÐp c¸c nhµ khoa häc giê ®©y cã thÓ nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ vµ sù t−¬ng t¸c cña chóng víi nhau, còng nh− cã thÓ so s¸nh hÖ gen tõ c¸c loµi kh¸c nhau. HÖ gen häc lµ mét tµi nguyªn th«ng tin phong phó vµ chuyªn s©u cã thÓ tr¶ lêi c¸c c©u hái c¬ b¶n vÒ c¸ch tæ chøc cña c¸c hÖ gen, vÒ sù ®iÒu hßa sù biÓu hiÖn c¸c gen, vÒ c¸c qu¸ tr×nh sinh tr−ëng vµ ph¸t triÓn, kÓ c¶ tiÕn hãa. Nh÷ng thµnh c«ng trong lÜnh vùc gi¶i tr×nh tù c¸c hÖ gen vµ kh¶ n¨ng nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ kh¸c nhau ®· thóc ®Èy c¸c nhµ khoa häc nç lùc nghiªn cøu mét hÖ thèng t−¬ng tù c¸c bé protein ®Çy ®ñ (proteom) ®−îc m· hãa t−¬ng øng bëi c¸c hÖ gen, tõ ®ã h×nh thµnh nªn mét lÜnh vùc nghiªn cøu míi gäi lµ hÖ protein häc (proteomics). C¸c protein, chø kh«ng ph¶i c¸c gen m· hãa chóng, trong thùc tÕ thùc hiÖn phÇn lín c¸c ho¹t ®éng sèng cña tÕ bµo. V× vËy, ®Ó t×m hiÓu sù biÓu hiÖn chøc n¨ng sinh häc cña c¸c tÕ bµo vµ c¬ thÓ, chóng ta ph¶i t×m hiÓu c¸c protein ®−îc t¹o ra khi nµo vµ ë ®©u trong mçi c¬ thÓ, còng nh− viÖc chóng t−¬ng t¸c víi nhau thÕ nµo trong c¸c m¹ng l−íi t−¬ng t¸c ph©n tö. C¸c hÖ thèng ®−îc t×m hiÓu thÕ nµo: mét vÝ dô C¸c lÜnh vùc hÖ gen häc vµ hÖ protein häc cho phÐp c¸c nhµ sinh häc tiÕn hµnh c¸c nghiªn cøu vÒ sù sèng ë qui m« ngµy cµng réng lín vµ theo xu h−íng toµn cÇu. B»ng viÖc sö dông c¸c c«ng cô mµ chóng ta ®· m« t¶, c¸c nhµ sinh häc ®· b¾t ®Çu tËp hîp c¸c d÷ liÖu vÒ c¸c gen vµ c¸c protein, tøc lµ liÖt kª tÊt c¶ c¸c “cÊu phÇn” tham gia vµo viÖc ®iÒu hµnh c¸c ho¹t ®éng cña tÕ bµo, m« vµ c¬ thÓ. Víi tËp hîp c¸c d÷ liÖu nh− vËy, c¸c nhµ nghiªn cøu cã thÓ chuyÓn mèi quan t©m cña hä tõ mçi cÊu phÇn ®¬n lÎ sang sù biÓu hiÖn chøc n¨ng ë d¹ng tæ hîp gåm nhiÒu cÊu phÇn ë c¸c cÊp ®é cña hÖ thèng sinh häc. Nhí l¹i ë Ch−¬ng 1, chóng ta ®· ®Ò cËp ®Õn “sinh häc hÖ thèng” lµ lÜnh vùc m« h×nh hãa c¸c biÓu hiÖn ho¹t ®éng n¨ng ®éng cña c¸c hÖ thèng sinh häc toµn bé. Mét øng dông c¬ b¶n cña h−íng nghiªn cøu sinh häc hÖ thèng lµ x¸c ®Þnh ®−îc c¸c m¹ch nèi tiÕp gi÷a c¸c gen vµ c¸c m¹ng l−íi t−¬ng t¸c cña c¸c protein. Ch¼ng h¹n nh−, ®Ó x©y dùng ®−îc s¬ ®å m¹ng l−íi t−¬ng t¸c gi÷a c¸c protein ë ruåi Drosophila nh− ®−îc nªu ë Ch−¬ng 1, c¸c nhµ nghiªn cøu ®· b¾t ®Çu tõ trªn 10.000 b¶n phiªn m· ARN dù ®o¸n. Sau ®ã, b»ng c¸c ph−¬ng ph¸p ph©n tö, hä ®· kiÓm tra sù t−¬ng t¸c gi÷a toµn bé hoÆc mét phÇn c¸c s¶n phÈm protein thu ®−îc c¸c b¶n phiªn m· nµy. B»ng viÖc sö dông c¸c phÐp ph©n tÝch thèng kª ®Ó chän ra c¸c mèi t−¬ng t¸c cã sè liÖu thuyÕt phôc nhÊt, hä ®· t×m ra kho¶ng 4700 lo¹i protein biÓu hiÖn tham gia vµo 4000 mèi t−¬ng t¸c kh¸c nhau. Mét phÇn trong nh÷ng mèi t−¬ng t¸c nµy ®−îc minh häa ë d¹ng s¬ ®å trªn H×nh 21.5; chi tiÕt cã thÓ ®−îc nh×n dÔ h¬n ë hai h×nh phãng to bªn d−íi. §Ó cã thÓ xö lý mét sè lín c¸c d÷ liÖu thu ®−îc vÒ c¸c mèi t−¬ng t¸c protein - protein phøc t¹p thu ®−îc tõ c¸c thÝ nghiÖm nµy, ®ång thêi cã thÓ tæ hîp chóng víi nhau d−íi d¹ng c¸c s¬ ®å m« h×nh, chóng ta cÇn ®Õn c¸c hÖ thèng m¸y tÝnh hiÖu n¨ng cao, c¸c c«ng cô to¸n häc vµ c¸c phÇn mÒm ®−îc ph¸t triÓn míi. Nh− vËy, cã thÓ nãi sinh häc hÖ thèng trong thùc tÕ ®· trë thµnh hiÖn thùc nhê c¸c tiÕn bé cña tin sinh häc. øng dông sinh häc hÖ thèng trong y häc Dù ¸n Atl¸t HÖ gen Ung th− lµ mét vÝ dô kh¸c vÒ sinh häc hÖ thèng mµ ë ®ã ng−êi ta ®ång thêi tiÕn hµnh ph©n tÝch mét sè lín c¸c gen vµ s¶n phÈm cña gen t−¬ng t¸c víi nhau. Dù ¸n nµy ®Æt d−íi sù chØ ®¹o phèi hîp cña ViÖn Ung th− Quèc gia (Mü)vµ NIH nh»m t×m hiÓu nh÷ng thay ®æi trong c¸c hÖ thèng sinh häc dÉn ®Õn sù ph¸t sinh ung th−. Trong giai ®o¹n 3 n¨m thö nghiÖm dù ¸n (tõ 2007 ®Õn 2010), c¸c nhµ nghiªn cøu tËp trung ph©n tÝch ba lo¹i ung th− lµ ung th− phæi, ung th− buång trøng vµ u nguyªn bµo ®Öm (glioblastoma) th«ng qua viÖc t×m hiÓu sù kh¸c nhau trong tr×nh tù cña c¸c gen vµ sù biÓu hiÖn cña chóng ë c¸c tÕ bµo ung th− so víi c¸c tÕ bµo b×nh th−êng. Mét tËp hîp gåm kho¶ng 2000 gen ë c¸c tÕ bµo ung th− sÏ ®−îc gi¶i tr×nh tù vµo c¸c thêi ®iÓm kh¸c nhau trong qu¸ tr×nh tiÕn triÓn cña bÖnh nh»m t×m ra nh÷ng thay ®æi hoÆc g©y ra do ®ét biÕn hoÆc g©y ra bëi c¸c c¬ chÕ s¾p xÕp l¹i nhiÔm s¾c thÓ kh¸c. NÕu nh÷ng nghiªn cøu nµy thµnh c«ng, chóng sÏ ®−îc më réng ¸p dông ®Ó nghiªn cøu c¸c lo¹i bÖnh ung th− kh¸c. H×nh 21.5 Sinh häc hÖ thèng tiÕp cËn c¸c t−¬ng t¸c protein. B¶n ®å t−¬ng t¸c protein tæng thÓ nµy hiÓn thÞ mét tËp hîp con cña c¸c t−¬ng t¸c nhiÒu kh¶ n¨ng nhÊt (®−êng kÎ nèi) tõ 2300 protein (vßng trßn nhá) ë ruåi Drosophila. Ba mµu nÒn kh¸c nhau trªn b¶n ®å t−¬ng øng víi vÞ trÝ chung cña mçi protein: mµu xanh lôc lµ nh©n, xanh lam lµ tÕ bµo chÊt vµ vµng lµ mµng sinh chÊt. C¸c protein ®−îc “m· hãa” b»ng mµu t−¬ng øng víi vÞ trÝ ®Þnh vÞ trong tÕ bµo ®Æc thï cña chóng; vÝ dô, c¸c vßng trßn mµu xanh lôc lµ c¸c protein trong nh©n. C¸c protein
  7. 7. 432 khèi kiÕn thøc 3 Di truyÒn häc Sinh häc hÖ thèng cã tiÒm n¨ng øng dông to lín trong y häc, mÆc dï hiÖn nay nã míi b¾t ®Çu ®−îc triÓn khai. §Õn nay, ng−êi ta ®· t¹o ra ®−îc c¸c lo¹i chip vi d·y (microarray) lµm b»ng thñy tinh hoÆc silicon chøa phÇn lín c¸c gen ®· biÕt cña ng−êi (H×nh 21.6). Nh÷ng chip nh− vËy ®ang ®−îc sö dông ®Ó ph©n tÝch sù biÓu hiÖn cña c¸c gen ë nh÷ng bÖnh nh©n m¾c c¸c chøng bÖnh ung th− kh¸c nhau vµ mét sè bÖnh lý kh¸c n÷a. Môc ®Ých cuèi cïng cña nh÷ng nghiªn cøu nµy lµ ®Ò ra c¸c ph¸c ®å ®iÒu trÞ phï hîp ®Æc thï víi b¶n chÊt di truyÒn cña mçi bÖnh nh©n vµ ®Æc tr−ng ®èi víi mçi lo¹i bÖnh ung th− mµ hä m¾c ph¶i. C¸ch tiÕp cËn nµy ®· ®¹t ®−îc mét sè thµnh c«ng nhÊt ®Þnh trong viÖc x¸c ®Þnh ®−îc ®Æc tÝnh ë mét sè nhãm bÖnh ung th−. Cuèi cïng, mçi ng−êi chóng ta cã thÓ cã mét “hå s¬ y häc” cïng víi c¸c tr×nh tù ADN cña m×nh; ®ã lµ mét tËp hîp nhá th«ng tin di truyÒn víi c¸c vïng hÖ gen ®−îc “®¸nh dÊu” cho biÕt xu h−íng mÉn c¶m víi nh÷ng bÖnh nhÊt ®Þnh. Lóc nµy, tiÒm n¨ng øng dông trong phßng tr¸nh vµ ®iÒu trÞ bÖnh ®èi víi mçi ng−êi sÏ thµnh hiÖn thùc. Sinh häc hÖ thèng lµ mét c¸ch tiÕp cËn nghiªn cøu hiÖu qu¶ vÒ c¸c thuéc tÝnh ë cÊp ®é ph©n tö. Tõ Ch−¬ng 1 chóng ta nhí l¹i r»ng, c¸c thuéc tÝnh míi ®−îc t×m thÊy ë cÊp ®é tæ chøc phøc t¹p h¬n th−êng b¾t nguån tõ sù s¾p xÕp c¸c “khèi cÊu tróc” cña cÊp ®é tæ chøc thÊp h¬n. Khi chóng ta hiÓu biÕt ngµy cµng ®Çy ®ñ h¬n vÒ c¸ch s¾p xÕp vµ tæ hîp cña c¸c cÊu phÇn thuéc c¸c hÖ thèng di truyÒn, chóng ta cµng hiÓu biÕt s©u h¬n vÒ ho¹t ®éng cña c¸c c¬ thÓ sèng. PhÇn cßn l¹i cña ch−¬ng nµy sÏ ®Ò cËp ®Õn nh÷ng kiÕn thøc mµ chóng ta ®· häc ®−îc ®Õn nµy nhê c¸c nghiªn cøu thuéc lÜnh vùc hÖ gen häc. TÝnh ®Õn ®Çu n¨m 2008, viÖc gi¶i tr×nh tù cña trªn 700 hÖ gen ®· hoµn thµnh vµ kho¶ng trªn 2700 hÖ gen kh¸c ®ang tiÕp tôc ®−îc gi¶i tr×nh tù. Trong nhãm c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù hoµn toµn, cã kho¶ng 600 hÖ gen vi khuÈn vµ 50 hÖ gen vi khuÈn cæ. Trong sè 65 loµi sinh vËt nh©n thËt thuéc nhãm nµy cã c¸c loµi ®éng vËt cã x−¬ng sèng, c¸c loµi ®éng vËt kh«ng x−¬ng sèng, c¸c nguyªn sinh ®éng vËt, nÊm vµ thùc vËt. C¸c tr×nh tù hÖ gen ®· ®−îc tÝch lòy chøa ®ùng mét tµi nguyªn th«ng tin phong phó mµ hiÖn nay chóng ta míi b¾t ®Çu khai th¸c. Cho ®Õn nay chóng ta ®· häc ®−îc g× tõ viÖc so s¸nh c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù? Trong môc nµy, chóng ta sÏ xem xÐt c¸c ®Æc tÝnh vÒ kÝch cì hÖ gen, sè gen vµ mËt ®é gen cña chóng. Do xÐt vÒ chi tiÕt, c¸c ®Æc tÝnh nµy rÊt ®a d¹ng, nªn chóng ta chØ nhÊn m¹nh vµo c¸c xu h−íng chung; tuy vËy, bªn c¹nh c¸c xu h−íng chung th× th−êng xuÊt hiÖn c¸c ngo¹i lÖ. KÝch cì hÖ gen Khi so s¸nh hÖ gen gi÷a ba liªn giíi (vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt), chóng ta nhËn thÊy mét xu h−íng kh¸c biÖt chung vÒ kÝch cì hÖ gen gi÷a c¸c sinh vËt nh©n s¬ (vi khuÈn vµ vi khuÈn cæ) víi sinh vËt nh©n thËt (B¶ng 21.1). Ngoµi mét sè ngo¹i lÖ, phÇn lín hÖ gen vi khuÈn cã kÝch cì tõ 1 ®Õn 6 triÖu cÆp baz¬ (bp); ch¼ng h¹n nh− hÖ gen cña E. coli lµ 4,6 triÖu bp. HÖ gen cña c¸c vi khuÈn cæ trong phÇn lín tr−êng hîp cã kÝch cì gièng víi hÖ gen vi khuÈn. (Tuy vËy, cÇn ph¶i nhí r»ng míi chØ cã mét sè Ýt hÖ gen vi khuÈn cæ ®· ®−îc gi¶i tr×nh tù hoµn toµn, v× vËy “bøc tranh toµn c¶nh” nµy còng cã thÓ sÏ thay ®æi.) C¸c hÖ gen sinh vËt nh©n thËt cã xu h−íng lín h¬n. HÖ gen cña nÊm men ®¬n bµo Saccharomyces cerevisiae lµ kho¶ng 13 Mb (triÖu cÆp baz¬); trong khi ®ã, phÇn lín c¸c loµi ®éng vËt vµ thùc vËt, tøc lµ c¸c sinh vËt ®a bµo, cã kÝch cì hÖ gen Ýt nhÊt lµ 100 Mb. HÖ gen ruåi giÊm cã kÝch cì lµ 180 Mb, cßn hÖ gen ng−êi lµ 3.200 Mb, nghÜa lµ lín h¬n tõ 500 ®Õn 3000 lÇn so víi mét hÖ gen vi khuÈn ®iÓn h×nh. Bªn c¹nh sù kh¸c biÖt chung gi÷a hÖ gen cña c¸c sinh vËt nh©n s¬ vµ sinh vËt nh©n thËt, th× viÖc so s¸nh kÝch cì hÖ gen trong ph¹m vi c¸c loµi sinh vËt nh©n thËt l¹i kh«ng ph¶n ¸nh mèi t−¬ng quan cã hÖ thèng gi÷a kÝch cì hÖ gen víi kiÓu h×nh cña c¸c loµi sinh vËt. Ch¼ng h¹n nh−, hÖ gen cña loµi Fritillaria assyriaca, mét loµi hoa thuéc hä lily, cã kÝch cì lµ 120 tØ cÆp baz¬ (120.000 Mb), tøc lµ lín h¬n kho¶ng 40 lÇn so víi hÖ gen ng−êi. Nh−ng cßn kinh ng¹c h¬n lµ hÖ gen mét loµi amip ®¬n bµo, Amoeba dubia, cã kÝch cì kho¶ng 670.000 Mb. (HÖ gen loµi nµy ch−a ®−îc gi¶i tr×nh tù.) Trong ph¹m vi hÑp h¬n, viÖc so s¸nh hÖ gen gi÷a hai loµi c«n trïng cho thÊy hÖ gen cña dÕ (Anabrus simplex) lín h¬n 11 lÇn so víi hÖ gen cña ruåi giÊm (Drosophila melanogaster). KÝch cì hÖ gen còng biÕn ®éng réng trong ph¹m vi mçi nhãm loµi nguyªn sinh ®éng vËt, c«n trïng, l−ìng c− vµ thùc vËt; nh−ng Ýt biÕn ®éng h¬n trong ph¹m vi c¸c loµi thó vµ bß s¸t. Sè gen Mét xu h−íng kh¸c biÖt t−¬ng tù còng ®óng khi xÐt vÒ sè gen: nghÜa lµ, nh×n chung c¸c vi khuÈn vµ vi khuÈn cæ cã Ýt gen h¬n so víi sinh vËt nh©n thËt. C¸c vi khuÈn vµ vi khuÈn cæ sèng tù 21.3 Kh¸i niÖm C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen H×nh 21.6 Mét chip ph©n tÝch gen ng−êi. C¸c ®iÓm nhá chøa ADN ®−îc xÕp thµnh c¸c ®−êng kÎ « trªn b¶n silicon nµy ®¹i diÖn cho hÇu hÕt c¸c gen trong hÖ gen ng−êi. Nhê sö dông chip nµy, c¸c nhµ nghiªn cøu cã thÓ ph©n tÝch cïng lóc møc biÓu hiÖn cña tÊt c¶ c¸c gen, qua ®ã gióp gi¶m l−îng hãa chÊt cÇn dïng tèi ®a ®ång thêi ®¶m b¶o ®iÒu kiÖn ®ång ®Òu cho tÊt c¶ c¸c gen. 21.2 1. Internet cã vai trß nh− thÕ nµo trong c¸c nghiªn cøu hiÖn nay vÒ c¸c hÖ gen häc vµ protein häc ? 2. H·y gi¶i thÝch −u thÕ cña c¸c nghiªn cøu theo h−íng sinh häc hÖ thèng khi t×m hiÓu vÒ ung th− so víi ph−¬ng ph¸p nghiªn cøu ®éc lËp tõng gen vµo mçi thêi ®iÓm. 3. Gi¶ sö b¹n ®ang dïng mét ph−¬ng ph¸p nghiªn cøu di truyÒn kinh ®iÓn ®Ó t×m hiÓu mét tÝnh tr¹ng di truyÒn ë ruåi Drosophila. Cô thÓ, b¹n ®· g©y ®ét biÕn ë ruåi vµ chän läc ra ®−îc c¸c c¸ thÓ cã kiÓu h×nh mµ b¹n quan t©m. Gi¶ thiÕt b¹n còng cã thÓ sö dông c¸c c«ng cô sinh häc ph©n tö ®Ó thu ®−îc vïng ADN mang ®ét biÕn. B¹n sÏ tiÕp tôc ph©n tÝch ®ét biÕn ®ã nh− thÕ nµo ®Ó cã thÓ x¸c ®Þnh ®−îc c¸ch mµ nã liªn quan ®Õn kiÓu h×nh ®−îc quan t©m ? Xem gîi ý tr¶ lêi ë Phô lôc A. KiÓm tra kh¸i niÖm ®iÒu g× NÕu
  8. 8. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 433 do cã tõ 1500 ®Õn 7500 gen, trong khi sè gen ë c¸c sinh vËt nh©n thËt dao ®éng tõ kho¶ng 5000 gen ë c¸c nÊm ®¬n bµo cho ®Õn Ýt nhÊt 40.000 gen ë mét sè loµi sinh vËt nh©n thËt ®a bµo (xem B¶ng 21.1). Trong ph¹m vi c¸c loµi sinh vËt nh©n thËt, sè gen ë mçi loµi th−êng thÊp h¬n sè gen ®−îc dù ®o¸n ®¬n thuÇn trªn c¬ së kÝch cì hÖ gen cña chóng. Nh×n vµo B¶ng 21.1, b¹n cã thÓ thÊy hÖ gen giun trßn C. elegans cã kÝch cì lµ 100 Mb vµ chøa kho¶ng 20.000 gen. Trong khi ®ã, hÖ gen Drosophila cã kÝch c¬ gÇn gÊp ®«i (180 Mb), song chØ cã sè gen b»ng kho¶ng hai phÇn ba - tøc lµ, chØ cã 13.700 gen. H·y xem mét vÝ dô kh¸c gÇn gòi h¬n, chóng ta ®Ó ý thÊy hÖ gen ng−êi chøa 3200 Mb, tøc lµ lín h¬n kho¶ng trªn 10 lÇn so víi c¸c hÖ gen Drosophila vµ C. elegans. Khi Dù ¸n HÖ gen Ng−êi khëi ®éng, trªn c¬ së sè protein ®· biÕt, c¸c nhµ sinh häc mong ®îi sÏ cã kho¶ng tõ 50.000 ®Õn 100.000 gen sÏ ®−îc x¸c ®Þnh sau khi hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen. Däc theo tiÕn tr×nh triÓn khai dù ¸n, sè gen −íc l−îng cã trong hÖ gen ng−êi ®−îc söa ®æi nhiÒu lÇn theo xu h−íng gi¶m dÇn; vµ ®Õn n¨m 2007, sè gen −íc l−îng ®−îc tin cËy h¬n c¶ dõng ë con sè 20.488 gen. Sè l−îng gen t−¬ng ®èi thÊp nµy, chØ gÇn gièng sè gen cã ë loµi giun trßn C. elegans, ®· g©y söng sèt nhiÒu nhµ sinh häc vèn ®· lu«n mong ®îi hÖ gen ng−êi cã nhiÒu gen h¬n. Thuéc tÝnh di truyÒn nµo ®· cho phÐp loµi ng−êi (vµ nhiÒu loµi ®éng vËt cã x−¬ng sèng kh¸c) tiÕn hãa mµ kh«ng cÇn nhiÒu gen h¬n so víi giun trßn? Mét yÕu tè quan träng ®ã lµ c¸c tr×nh tù m· hãa trong c¸c hÖ gen ®éng vËt cã x−¬ng sèng cã ®Æc ®iÓm “mét vèn bèn lêi” do chóng cã nhiÒu c¸ch c¾t - nèi c¸c b¶n phiªn m· kh¸c nhau. Chóng ta nhí l¹i r»ng qu¸ tr×nh nµy cã thÓ t¹o ra nhiÒu h¬n mét lo¹i protein biÓu hiÖn chøc n¨ng xuÊt ph¸t tõ mét gen duy nhÊt (xem H×nh 18.11). VÝ dô nh−, hÇu hÕt c¸c gen ë ng−êi ®Òu chøa nhiÒu exon, vµ −íc l−îng cã kho¶ng 75% sè gen gåm nhiÒu exon nµy ®−îc c¾t - nèi Ýt nhÊt b»ng hai c¸ch kh¸c nhau. NÕu chóng ta gi¶ thiÕt mçi gen khi ®−îc c¾t nèi theo c¸c c¸ch kh¸c nhau trung b×nh x¸c ®Þnh 3 chuçi polypeptit kh¸c nhau, th× tæng sè chuçi polypeptit kh¸c nhau ë ng−êi sÏ ®¹t con sè kho¶ng 75.000. Sù ®a d¹ng cña c¸c chuçi polypeptit thùc tÕ cßn bæ sung thªm bëi c¸c biÕn ®æi sau dÞch m·, ch¼ng h¹n bëi sù c¾t tØa c¸c axit amin hay g¾n thªm c¸c gèc cacbohydrat diÔn ra kh¸c nhau ë c¸c tÕ bµo kh¸c nhau hoÆc ë c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn. MËt ®é gen vµ c¸c tr×nh tù ADN kh«ng m· hãa Bªn c¹nh kÝch cì hÖ gen vµ sè gen, chóng ta còng cã thÓ so s¸nh mËt ®é gen ë nh÷ng loµi kh¸c nhau, nghÜa lµ cã bao nhiªu gen trªn mét ®¬n vÞ chiÒu dµi cña ADN. Khi chóng ta so s¸nh hÖ gen gi÷a c¸c loµi vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt, chóng ta thÊy sinh vËt nh©n thËt th−êng cã hÖ gen lín h¬n nh−ng l¹i cã sè gen Ýt h¬n trªn cïng mét sè nhÊt ®Þnh c¸c cÆp baz¬. Ng−êi cã kÝch cì hÖ gen lín h¬n hµng tr¨m thËm chÝ hµng ngh×n lÇn so víi hÖ gen cña phÇn lín c¸c loµi vi khuÈn, nh−ng nh− chóng ta ®· nãi, ng−êi chØ cã sè gen gÊp tõ 5 ®Õn 15 lÇn so víi nh÷ng loµi nµy; nh− vËy, mËt ®é gen ë ng−êi lµ thÊp h¬n (xem B¶ng 21.1). Ngay c¶ c¸c loµi sinh vËt nh©n thËt ®¬n bµo, nh− nÊm men, còng cã Ýt gen h¬n trong mçi mét triÖu cÆp baz¬ so víi c¸c loµi vi khuÈn vµ vi khuÈn cæ. Trong sè c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù hoµn toµn ®Õn nay, ng−êi vµ c¸c loµi thó cã mËt ®é gen thÊp nhÊt. Trong tÊt c¶ c¸c hÖ gen vi khuÈn ®· ®−îc nghiªn cøu ®Õn nay, phÇn lín ADN chøa c¸c gen m· hãa cho protein, tARN hoÆc rARN; mét l−îng nhá cña c¸c tr×nh tù ADN cßn l¹i gåm chñ yÕu lµ c¸c tr×nh tù ®iÒu hßa kh«ng ®−îc phiªn m·, ch¼ng h¹n nh− c¸c tr×nh tù khëi ®Çu phiªn m· (promoter). Tr×nh tù c¸c nucleotit däc theo mét gen m· hãa protein ë vi khuÈn th−êng kh«ng bÞ ng¾t qu·ng tõ vÞ trÝ b¾t ®Çu cho ®Õn vÞ trÝ kÕt thóc bëi c¸c tr×nh tù kh«ng m· hãa (intron). Ng−îc l¹i, ë c¸c hÖ gen sinh vËt nh©n thËt, phÇn lín ADN hoÆc kh«ng ®−îc dïng ®Ó m· hãa cho protein hoÆc kh«ng ®−îc phiªn m· thµnh c¸c ph©n tö ARN biÓu hiÖn chøc n¨ng (nh− tARN ch¼ng h¹n), ®ång thêi ADN chøa nhiÒu tr×nh tù ®iÒu hßa phøc t¹p. Trong thùc tÕ, hÖ gen ng−êi chøa ADN kh«ng m· hãa nhiÒu h¬n kho¶ng 10.000 lÇn so víi hÖ gen vi khuÈn. Mét sè tr×nh tù ADN kh«ng m· hãa nµy ë sinh vËt nh©n thËt ®a bµo xuÊt hiÖn trong c¸c intron cña c¸c gen. Thùc tiÔn cho thÊy c¸c intron lµ nh©n tè chÝnh dÉn ®Õn phÇn lín c¸c kh¸c biÖt vÒ chiÒu dµi trung b×nh gi÷a c¸c gen cña ng−êi (27.000 bp) so víi c¸c gen cña vi khuÈn (1000 bp). B¶ng 21.1 KÝch cì hÖ gen vµ sè gen −íc tÝnh* Loµi KÝch cì hÖ gen ®¬n béi (Mb) Sè gen Sè gen / Mb Vi khuÈn Haemophilus influenzae 1,8 1700 940 Escherichia coli 4,6 4400 950 Vi khuÈn cæ Archaeoglobus fulgidus 2,2 2500 1130 Methanosarcina barkeri 4,8 3600 750 Sinh vËt nh©n thËt Saccharomyces cerevisiae (nÊm men) 13 6200 480 Caenorhabditis elegans (giun trßn) 100 20.000 200 Arabidopsis thaliana (c©y thuéc hä mï t¹t) 118 25.500 215 Drosophila melanogaster (ruåi giÊm) 180 13.700 76 Oryza sativa (lóa g¹o) 390 40.000 140 Danio rerio (c¸ ngùa) 1700 23.000 13 Mus musculus (chuét nhµ) 2600 22.000 11 Homo sapiens (ng−êi) 3200 20.500 7 Fritillaria assyriaca (c©y thuéc hä lily) 120.000 ND ND * Mét sè sè liÖu trªn ®©y cã thÓ sÏ ®−îc chØnh lý sau nµy do c¸c ph©n tÝch hÖ gen vÉn ®ang tiÕp tôc tiÕn hµnh. Mb = 1 triÖu cÆp baz¬ (bp). ND = ch−a x¸c ®Þnh.
  9. 9. 434 khèi kiÕn thøc 3 Di truyÒn häc Bªn c¹nh c¸c intron, c¸c sinh vËt nh©n thËt ®a bµo chøa mét l−îng lín ADN kh«ng m· hãa ë gi÷a c¸c gen. Trong môc tiÕp theo, chóng ta sÏ m« t¶ thµnh phÇn vµ c¸ch s¾p xÕp c¸c chuçi tr×nh tù lín cña ADN nh− vËy trong hÖ gen ng−êi. §Õn ®©y, cã thÓ nãi chóng ta ®· dïng phÇn lín dung l−îng cña ch−¬ng nµy, mµ thùc tÕ lµ cña c¶ khèi kiÕn thøc nµy, ®Ó tËp trung nãi vÒ c¸c gen m· hãa protein. Nh−ng trong thùc tÕ, c¸c vïng m· hãa cña nh÷ng gen nµy vµ c¸c gen m· hãa cho c¸c s¶n phÈm ARN nh− rARN, tARN vµ tiÓu-ARN (miARN hay microARN) chØ chiÕm mét tØ lÖ nhá trong hÖ gen cña phÇn lín c¸c sinh vËt nh©n thËt ®a bµo. Mét phÇn lín hÖ gen cña hÇu hÕt sinh vËt nh©n thËt lµ c¸c tr×nh tù ADN hoÆc kh«ng m· hãa cho protein hoÆc kh«ng ®−îc phiªn m· ®Ó t¹o nªn c¸c lo¹i ARN cã chøc n¨ng ®· biÕt; nh÷ng tr×nh tù ADN kh«ng m· hãa nµy tr−íc kia th−êng ®−îc m« t¶ nh− c¸c “ADN d− thõa”. Tuy vËy, ngµy cµng cã nhiÒu b»ng chøng cho thÊy nh÷ng tr×nh tù ADN nµy gi÷ vai trß quan träng trong ho¹t ®éng sèng cña tÕ bµo; ý t−ëng nµy ®ång thêi ®−îc cñng cè bëi sù tån t¹i mét c¸ch “bÒn v÷ng” qua hµng tr¨m thÕ hÖ cña nh÷ng tr×nh tù nµy ë nhiÒu hÖ gen kh¸c nhau. Ch¼ng h¹n, khi so s¸nh hÖ gen gi÷a ng−êi víi chuét ®ång vµ chuét nhµ, c¸c nhµ nghiªn cøu t×m thÊy cã ®Õn 500 vïng ADN kh«ng m· hãa trong hÖ gen gièng hÖt nhau ë c¶ ba loµi. ë nh÷ng loµi nµy, møc ®é b¶o thñ cña nh÷ng tr×nh tù nµy thËm chÝ cßn cao h¬n so víi c¸c vïng m· hãa protein; ®iÒu nµy ñng hé m¹nh mÏ cho gi¶ thiÕt c¸c vïng kh«ng m· hãa cã nh÷ng chøc n¨ng quan träng. Trong môc nµy chóng ta sÏ t×m hiÓu c¸c gen vµ c¸c tr×nh tù ADN kh«ng m· hãa ®−îc tæ chøc nh− thÕ nµo trong hÖ gen cña c¸c sinh vËt nh©n thËt, víi vÝ dô chñ yÕu chÝnh lµ hÖ gen ng−êi cña chóng ta. C¸ch tæ chøc cña hÖ gen cho chóng ta biÕt con ®−êng mµ c¸c hÖ gen ®· vµ ®ang tiÕp tôc tiÕn hãa; ®©y còng lµ néi dung ®−îc ®Ò cËp tiÕp theo. Khi hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn toµn, mét sù thËt ®−îc béc lé râ rµng lµ chØ cã 1,5% tr×nh tù nucleotit trong hÖ gen ®−îc dïng hoÆc ®Ó m· hãa cho c¸c protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö rARN vµ tARN. H×nh 21.7 cho thÊy thµnh phÇn cÊu tróc nªn 98,5% tr×nh tù cßn l¹i cña hÖ gen ng−êi. C¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen vµ c¸c tr×nh tù intron chiÕm 24% hÖ gen ng−êi; phÇn cßn l¹i, n»m gi÷a c¸c gen biÓu hiÖn chøc n¨ng (c¸c tr×nh tù liªn gen), gåm c¸c tr×nh tù kh«ng m· hãa ®¬n nhÊt, ch¼ng h¹n nh− c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶, tøc lµ c¸c gen cò vèn tõng tån t¹i nh−ng sau ®ã do tÝch lòy c¸c ®ét biÕn ®· trë nªn mÊt chøc n¨ng. Tuy vËy, phÇn lín c¸c tr×nh tù ADN liªn gen lµ nh÷ng tr×nh tù ADN lÆp l¹i, tøc lµ c¸c tr×nh tù cã mÆt víi nhiÒu b¶n sao trong hÖ gen. §iÒu ®¸ng ng¹c nhiªn lµ ba phÇn t− cña c¸c tr×nh tù ADN lÆp l¹i nµy (t−¬ng øng víi 44% cña toµn bé hÖ gen ng−êi) t¹o nªn c¸c ®¬n vÞ ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng hoÆc c¸c tr×nh tù cã liªn quan ®Õn chóng. 21.4 Kh¸i niÖm Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m hãa vµ nhiÒu hä ®a gen 21.3 1. Theo c¸c sè liÖu −íc tÝnh hiÖn nay, hÖ gen ng−êi chøa kho¶ng 20.500 gen. Tuy vËy, cã b»ng chøng cho thÊy c¸c tÕ bµo ng−êi cã thÓ s¶n sinh nhiÒu h¬n 20.500 lo¹i chuçi polypeptide kh¸c nhau. Nh÷ng qu¸ tr×nh nµo cã thÓ gióp gi¶i thÝch cho sù “kh«ng nhÊt qu¸n” nµy? 2. Sè hÖ gen ®−îc gi¶i tr×nh tù ®ang tiÕp tôc t¨ng lªn ®Òu ®Æn. H·y sö dông trang web www.genomesonline.org ®Ó t×m sè hÖ gen hiÖn t¹i thuéc c¸c liªn giíi kh¸c nhau ®· ®−îc gi¶i tr×nh tù hoµn toµn, còng nh− sè hÖ gen ®ang tiÕp tôc ®−îc gi¶i tr×nh tù (gîi ý: H·y dïng chuét nh¸y kÐp vµo khÈu lÖnh “GOLD tables” råi sau ®ã nh¸y kÐp vµo “Published Complete Genomes” ®Ó cã thªm th«ng tin.) 3. C¸c qu¸ tr×nh tiÕn hãa nµo cã thÓ gi¶i thÝch cho viÖc c¸c sinh vËt nh©n s¬ cã hÖ gen nhá h¬n so víi c¸c sinh vËt nh©n thËt ? Xem gîi ý tr¶ lêi ë Phô lôc A. KiÓm tra kh¸i niÖm ®iÒu g× NÕu H×nh 21.7 C¸c lo¹i tr×nh tù ADN trong hÖ gen ng−êi. C¸c tr×nh tù gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö rARN hay tARN chØ chiÕm kho¶ng 1,5% hÖ gen ng−êi (mµu tÝa sÉm trªn biÓu ®å táa trßn), trong khi c¸c tr×nh tù ®iÒu hßa vµ c¸c intron liªn quan ®Õn c¸c gen (mµu tÝa nh¹t) chiÕm kho¶ng 1/4 hÖ gen. PhÇn lín h¬n c¶ cña hÖ gen ng−êi lµ nh÷ng tr×nh tù kh«ng m· hãa cho protein vµ còng kh«ng ®−îc dïng ®Ó t¹o ra c¸c lo¹i ARN ®· biÕt, mµ phÇn nhiÒu trong nh÷ng tr×nh tù nµy lµ c¸c ADN lÆp l¹i (mµu xanh lôc sÉm vµ nh¹t). Do ADN lÆp l¹i lµ nh÷ng tr×nh tù khã ph©n tÝch vµ khã gi¶i tr×nh tù h¬n c¶, nªn sù ph©n lo¹i cña mét phÇn nh÷ng tr×nh tù nµy ë trªn chØ cã tÝnh −íc ®o¸n, vµ c¸c tØ lÖ phÇn tr¨m ®−îc nªu cã thÓ sÏ thay ®æi ®«i chót khi c¸c nghiªn cøu ph©n tÝch hÖ gen vÉn ®ang tiÕp diÔn. Nh÷ng gen m· hãa c¸c miARN míi ®−îc t×m thÊy gÇn ®©y thuéc c¸c vïng ADN kh«ng m· hãa ®¬n nhÊt (tøc lµ kh«ng lÆp l¹i) vµ trong c¸c intron; nghÜa lµ, chóng thuéc hai vïng cña ®å thÞ táa trßn trªn ®©y. C¸c exon (c¸c vïng gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh rARN vµ tARN) (1,5%) Intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen (24%) C¸c tr×nh tù ADN kh«ng m· hãa ®¬n nhÊt (15%) ADN lÆp l¹i kh«ng liªn quan ®Õn c¸c yÕu tè vËn ®éng (15%) ADN lÆp l¹i bao gåm c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù liªn quan ®Õn chóng (44%) C¸c ®o¹n lÆp kÝch th−íc lín (5 - 6%) ADN tr×nh tù ®¬n gi¶n (3%) C¸c yÕu tè Alu (3%) C¸c tr×nh tù L1 (17%)
  10. 10. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 435 C¸c yÕu tè di truyÒn vËn ®éng vµ c¸c tr×nh tù cã liªn quan ®Õn chóng C¶ sinh vËt nh©n s¬ còng nh− sinh vËt nh©n thËt ®Òu cã trong hÖ gen nh÷ng ®o¹n tr×nh tù ADN cã thÓ di chuyÓn tõ vÞ trÝ nµy sang vÞ trÝ kh¸c trong hÖ gen. Nh÷ng ®o¹n tr×nh tù ADN nh− vËy ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng, hay ®−îc gäi t¾t lµ c¸c yÕu tè vËn ®éng. Trong qu¸ tr×nh ®−îc gäi lµ vËn ®éng, mét yÕu tè vËn ®éng sÏ di chuyÓn tõ mét vÞ trÝ trªn ADN trong tÕ bµo tíi mét vÞ trÝ ®Ých kh¸c nhê mét qu¸ tr×nh t¸i tæ hîp. §«i khi c¸c yÕu tè vËn ®éng ®−îc gäi lµ c¸c “gen nh¶y”, nh−ng thuËt ng÷ nµy thùc tÕ dÔ g©y hiÓu nhÇm bëi trong thùc tÕ nh÷ng ®o¹n tr×nh tù ADN vËn ®éng kh«ng bao giê rêi khái ADN cña tÕ bµo. (C¸c vÞ trÝ gèc vµ vÞ trÝ ®Ých míi cña c¸c yÕu tè vËn ®éng ®−îc ®−a ®Õn gÇn nhau bëi c¬ chÕ “bÎ cong” ADN.) B»ng chøng ®Çu tiªn vÒ c¸c ph©n ®o¹n ADN cã thÓ di chuyÓn ®−îc ph¸t hiÖn tõ c¸c thÝ nghiÖm lai gièng ë c©y ng« ®−îc nhµ n÷ di truyÒn häc ng−êi Mü lµ Barbara McClintock tiÕn hµnh vµo nh÷ng n¨m 1940 vµ 1950 (H×nh 21.8). Khi theo dâi c¸c c©y ng« qua nhiÒu thÕ hÖ, McClintock x¸c ®Þnh ®−îc sù thay ®æi mµu néi nhò cña c¸c h¹t ng« chØ cã thÓ gi¶i thÝch ®−îc nÕu nh− cã sù tån t¹i cña c¸c yÕu tè di truyÒn cã thÓ vËn ®éng tõ nh÷ng vÞ trÝ kh¸c trong hÖ gen vµo trong c¸c gen qui ®Þnh tÝnh tr¹ng mµu néi nhò, lµm “ph¸ vì” nh÷ng gen nµy vµ dÉn ®Õn hiÖn t−îng mµu néi nhò thay ®æi. Ph¸t hiÖn cña McClintock ban ®Çu ®−îc ®ãn nhËn b»ng nhiÒu “hoµi nghi” vµ thËm chÝ bÞ ph¶n ®èi. Ph¶i mÊt nhiÒu n¨m sau ®ã, c«ng tr×nh nghiªn cøu kú c«ng cïng nh÷ng ý t−ëng s©u s¾c cña McClintock vÒ c¸c yÕu tè vËn ®éng míi ®−îc x¸c nhËn bëi c¸c nhµ di truyÒn häc vi khuÈn vµ vi sinh vËt khi hä t×m ra c¬ së ph©n tö cña qu¸ tr×nh vËn ®éng cña nh÷ng yÕu tè nµy. Sù vËn ®éng cña c¸c transposon vµ retrotransposon C¸c sinh vËt nh©n thËt cã hai lo¹i yÕu tè vËn ®éng. Lo¹i thø nhÊt ®−îc gäi lµ c¸c transposon; lo¹i yÕu tè nµy vËn ®éng trong hÖ gen th«ng qua mét ADN trung gian. C¸c transposon cã thÓ vËn ®éng hoÆc bëi c¬ chÕ “c¾t - d¸n” vµ chóng ®−îc chuyÓn dêi khái vÞ trÝ gèc, hoÆc bëi c¬ chÕ “sao chÐp - d¸n” vµ chóng ®Ó l¹i mét b¶n sao t¹i vÞ trÝ gèc (H×nh 21.9a). PhÇn lín c¸c yÕu tè vËn ®éng trong hÖ gen sinh vËt nh©n thËt thuéc lo¹i thø hai, ®−îc gäi lµ c¸c retrotransposon; lo¹i yÕu tè nµy vËn ®éng trong hÖ gen th«ng qua mét ARN trung gian; ®©y lµ b¶n phiªn m· cña chÝnh ADN retrostransposon. C¸c retrotransposon lu«n ®Ó l¹i mét b¶n sao t¹i vÞ trÝ ®Ých trong qu¸ tr×nh vËn ®éng, do chóng ®−îc phiªn m· thµnh ARN trung gian (H×nh 21.9b). Tr−íc khi cµi vµo vÞ trÝ ®Ých, ph©n tö ARN trung gian ®−îc phiªn m· ng−îc trë l¹i thµnh ADN bëi enzym phiªn m· ng−îc - reverse transcriptase - do chÝnh retrotransposon m· hãa. §iÒu nµy cã nghÜa lµ enzym phiªn m· ng−îc cã thÓ cã mÆt trong c¸c tÕ bµo mµ chóng kh«ng nhÊt thiÕt ph¶i bÞ l©y nhiÔm bëi retrovirut. (Trong thùc tÕ, c¸c retrovirut, nh− ®· ®−îc ®Ò cËp ë Ch−¬ng 19, cã thÓ ®· tiÕn hãa b¾t nguån tõ chÝnh c¸c retrotransposon.) Ho¹t ®éng cµi tr×nh tù ADN ®−îc phiªn m· ng−îc vµo vÞ trÝ míi ®−îc xóc t¸c bëi enzym trong tÕ bµo. H×nh 21.8 ¶nh h−ëng cña c¸c yÕu tè vËn ®éng ®Õn mµu h¹t ng«. Barbara McClintock lµ ng−êi ®Çu tiªn ®−a ra ý t−ëng vÒ nh÷ng yÕu tè di truyÒn cã kh¶ n¨ng vËn ®éng khi quan s¸t hiÖn t−îng cã nhiÒu ®èm mµu kh¸c nhau trong nh©n cña c¸c h¹t ng«. Tuy ban ®Çu ý t−ëng cña bµ vµo nh÷ng n¨m 1940 ®−îc ®ãn nhËn bëi nh÷ng mèi hoµi nghi, nh−ng sau nµy ®· ®−îc kiÓm chøng lµ hoµn toµn x¸c thùc. Bµ ®−îc nhËn gi¶i Nobel n¨m 1983 khi ë tuæi 81 nhê c«ng tr×nh mang tÝnh tiªn phong cña m×nh. H×nh 21.9 Sù di chuyÓn cña c¸c yÕu tè vËn ®éng ë sinh vËt nh©n thËt. (a) Sù di chuyÓn cña c¸c transposon hoÆc theo c¬ chÕ “c¾t - d¸n” hoÆc theo c¬ chÕ “sao chÐp - d¸n” (®−îc minh häa ë ®©y) liªn quan ®Õn mét ph©n tö ADN sîi kÐp trung gian sau ®ã ®−îc cµi vµo hÖ gen. (b) Sù di chuyÓn cña c¸c retrotransposon b¾t ®Çu b»ng sù h×nh thµnh mét ph©n tö ARN m¹ch ®¬n trung gian. C¸c b−íc cßn l¹i vÒ b¶n chÊt gièng víi mét phÇn chu kú sinh s¶n cña retrovirut (xem H×nh 19.8). Trong kiÓu di chuyÓn cña c¸c transposon theo kiÓu “sao chÐp - d¸n” vµ kiÓu di chuyÓn cña retrotransposon, tr×nh tù ADN võa ®−îc duy tr× ë vÞ trÝ gèc võa xuÊt hiÖn ë vÞ trÝ míi. PhÇn (a) ë trªn sÏ kh¸c nh− thÕ nµo nÕu c¬ chÕ ®−îc minh häa ë ®©y lµ c¬ chÕ di chuyÓn kiÓu “c¾t - d¸n” ? Transposon ADN hÖ gen Transposon ®−îc sao chÐp Transposon vËn ®éng Cµi vµo hÖ gen B¶n sao míi cña transposon (a) Sù di chuyÓn cña transposon (c¬ chÕ kiÓu “sao chÐp - d¸n”) Retrotransposon ARN Reverse transcriptase Cµi vµo hÖ gen B¶n sao míi cña retrotransposon (b) Sù di chuyÓn cña retrotransposon
  11. 11. 436 khèi kiÕn thøc 3 Di truyÒn häc C¸c tr×nh tù liªn quan ®Õn c¸c yÕu tè vËn ®éng ë sinh vËt nh©n thËt, nhiÒu b¶n sao cña c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù liªn quan ®Õn chóng n»m r¶i r¸c kh¾p hÖ gen. Mçi ®¬n vÞ riªng lÎ cña yÕu tè vËn ®éng th−êng dµi tõ vµi tr¨m ®Õn vµi ngh×n cÆp baz¬, vµ c¸c b¶n sao n»m ph©n t¸n th−êng gièng nhau, nh−ng kh«ng gièng hÖt nhau. Mét sè yÕu tè vËn ®éng nh− vËy cã kh¶ n¨ng vËn ®éng; c¸c enzym cÇn thiÕt cho sù vËn ®éng cña nã cã thÓ ®−îc m· hãa bëi mét yÕu tè vËn ®éng bÊt kú, bao gåm c¶ chÝnh yÕu tè vËn ®éng ®ang ho¹t ®éng. Nh÷ng tr×nh tù kh¸c lµ nh÷ng tr×nh tù cã liªn quan nh−ng ®· mÊt hoµn toµn kh¶ n¨ng vËn ®éng. C¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù cã liªn quan chiÕm kho¶ng 25% - 50% hÖ gen ë phÇn lín ®éng vËt cã vó (xem H×nh 21.7); tØ lÖ nµy thËm chÝ cßn cao h¬n ë c¸c loµi l−ìng c− vµ nhiÒu loµi thùc vËt. ë ng−êi vµ nhiÒu loµi linh tr−ëng kh¸c, mét tØ lÖ lín c¸c tr×nh tù ADN liªn quan ®Õn c¸c yÕu tè vËn ®éng bao gåm mét hä c¸c tr×nh tù gièng nhau ®−îc gäi lµ c¸c yÕu tè Alu. Riªng nh÷ng tr×nh tù nµy ®· chiÕm kho¶ng 10% hÖ gen ng−êi. C¸c yÕu tè Alu cã chiÒu dµi kho¶ng 300 nucleotit, tøc lµ ng¾n h¬n nhiÒu so víi phÇn lín c¸c yÕu tè vËn ®éng cßn ho¹t ®éng kh¸c, vµ chóng kh«ng m· hãa cho bÊt cø protein nµo. Tuy vËy, nhiÒu yÕu tè Alu ®−îc phiªn m· thµnh ARN; chøc n¨ng trong tÕ bµo cña chóng (nÕu cã) ®Õn nay ch−a râ. Mét tØ lÖ lín h¬n (17%) cña hÖ gen ng−êi lµ mét lo¹i retrotransposon kh¸c, ®−îc gäi lµ c¸c yÕu tè LINE-1 hay L1. Nh÷ng yÕu tè nµy dµi h¬n nhiÒu so víi c¸c yÕu tè Alu (kho¶ng 6500 bp) vµ cã tØ lÖ vËn ®éng thÊp. T¹i sao tØ lÖ vËn ®éng cña c¸c yÕu tè lo¹i nµy l¹i thÊp? C¸c nghiªn cøu gÇn ®©y ph¸t hiÖn ra r»ng trong c¸c yÕu tè L1 cã c¸c tr×nh tù ng¨n c¶n ho¹t ®éng cña ARN polymerase vèn cÇn thiÕt cho sù vËn ®éng. Mét nghiªn cøu bæ sung t×m thÊy c¸c tr×nh tù L1 cã trong intron cña kho¶ng 80% sè gen ng−êi ®−îc ®em ph©n tÝch, ®iÒu nµy cho thÊy cã kh¶ n¨ng L1 gióp ®iÒu hßa biÓu hiÖn gen. Mét sè nhµ nghiªn cøu kh¸c cho r»ng: c¸c retrotransposon L1 cã thÓ cã hiÖu qu¶ biÖt hãa qua ®iÒu hßa biÓu hiÖn gen dÉn ®Õn sù ph¸t triÓn c¸c lo¹i n¬ron, gãp phÇn t¹o nªn sù ®a d¹ng cña c¸c lo¹i tÕ bµo n¬ron (xem Ch−¬ng 48). MÆc dï cã nhiÒu yÕu tè vËn ®éng m· hãa cho c¸c protein, nh−ng nh÷ng protein nµy kh«ng thùc hiÖn nh÷ng chøc n¨ng tÕ bµo b×nh th−êng. Do vËy, c¸c yÕu tè vËn ®éng th−êng ®−îc qui vµo nhãm ADN “kh«ng m· hãa”, cïng víi c¸c tr×nh tù lÆp l¹i dµi kh¸c cã trong hÖ gen. C¸c tr×nh tù ADN lÆp l¹i kh¸c, bao gåm c¶ c¸c ADN tr×nh tù ®¬n gi¶n C¸c tr×nh tù ADN lÆp l¹i vèn kh«ng liªn quan ®Õn c¸c yÕu tè vËn ®éng cã vÎ xuÊt hiÖn do c¸c sai sãt trong c¸c qu¸ tr×nh sao chÐp hoÆc t¸i tæ hîp cña ADN. Nh÷ng tr×nh tù ADN nh− vËy chiÕm kho¶ng 15% hÖ gen ng−êi (xem H×nh 21.7). Kho¶ng mét phÇn ba trong sè nµy (tøc lµ kho¶ng 5 - 6% hÖ gen ng−êi) lµ nh÷ng ®o¹n ADN dµi lÆp l¹i hai lÇn víi mçi ®¬n vÞ lÆp l¹i dµi tõ 10.000 ®Õn 30.000 cÆp baz¬. C¸c ®o¹n ADN dµi nh− vËy d−êng nh− ®· ®−îc sao chÐp tõ vÞ trÝ nµy sang vÞ trÝ kh¸c thuéc cïng mét nhiÔm s¾c thÓ hoÆc thuéc hai nhiÔm s¾c thÓ kh¸c nhau. Kh«ng gièng nh− c¸c b¶n sao cña c¸c tr×nh tù ADN dµi ph©n t¸n kh¾p hÖ gen, c¸c ADN tr×nh tù ®¬n gi¶n th−êng gåm nhiÒu b¶n sao cña c¸c ®o¹n tr×nh tù ng¾n lÆp l¹i liªn tiÕp nh− vÝ dô ®−îc minh häa d−íi ®©y (ë ®©y, chØ minh häa mét m¹ch): …GTTACGTTACGTTACGTTACGTTACGTTAC… Trong tr−êng hîp nµy, ®¬n vÞ lÆp l¹i (GTTAC) gåm 5 nucleotit. Trong thùc tÕ, c¸c ®¬n vÞ lÆp l¹i nh− vËy cã thÓ dµi ®Õn 500 nucleotit, nh−ng th−êng th× ng¾n h¬n 15 nucleotit nh− vÝ dô trªn ®©y. Khi ®¬n vÞ lÆp l¹i chØ chøa tõ 2 ®Õn 5 nucleotit, th× ®o¹n tr×nh tù lÆp l¹i liªn tiÕp nh− vËy ®−îc gäi lµ tr×nh tù ng¾n lÆp l¹i liªn tiÕp, hay cßn gäi lµ STR (short tandem repeats). Chóng ta ®· nãi vÒ viÖc sö dông chØ thÞ STR trong x©y dùng tµng th− di truyÒn ë Ch−¬ng 20. Sè b¶n sao cña cïng mét ®¬n vÞ lÆp l¹i cã thÓ kh¸c nhau ë nh÷ng vÞ trÝ kh¸c nhau trong hÖ gen. Ch¼ng h¹n nh−, ®¬n vÞ lÆp l¹i GTTAC cã thÓ xuÊt hiÖn liªn tiÕp hµng tr¨m ngh×n lÇn t¹i mét vÞ trÝ trong hÖ gen; nh−ng ë mét vÞ trÝ kh¸c, sè lÇn lÆp l¹i cña ®¬n vÞ nµy chØ b»ng mét nöa. Sè lÇn lÆp l¹i còng rÊt kh¸c nhau gi÷a ng−êi nµy víi ng−êi kh¸c, t¹o nªn sù kh¸c biÖt trong tµng th− di truyÒn cña mçi c¸ nh©n trªn c¬ së ph©n tÝch c¸c tr×nh tù STR. TÝnh tæng céng, c¸c ADN tr×nh tù ®¬n gi¶n chiÕm kho¶ng 3% hÖ gen ng−êi. Thµnh phÇn nucleotit cña c¸c ®o¹n ADN tr×nh tù ®¬n gi¶n kh¸c biÖt víi thµnh phÇn cña c¸c ®o¹n tr×nh tù ADN kh¸c trong hÖ gen ®Õn møc chóng t¹o nªn sù kh¸c biÖt vÒ tØ träng. NÕu ADN hÖ gen ®−îc c¾t thµnh c¸c ph©n ®o¹n nhá, råi ®−îc ly t©m ë tèc ®é cao, th× c¸c ph©n ®o¹n ADN cã tØ träng kh¸c nhau sÏ “®Þnh vÞ” ë nh÷ng vÞ trÝ kh¸c nhau trong èng ly t©m. C¸c ®o¹n ADN lÆp l¹i vèn ban ®Çu ®−îc ph©n lËp theo c¸ch nµy ®−îc gäi lµ c¸c tr×nh tù ADN vÖ tinh bëi v× c¸c b¨ng ly t©m cña chóng t¸ch biÖt khái phÇn b¨ng ly t©m chung gåm c¸c tr×nh tù ADN cßn l¹i cña hÖ gen gièng nh− mét “vÖ tinh”. ThuËt ng÷ “ADN vÖ tinh” vµ ADN tr×nh tù ®¬n gi¶n hiÖn nay th−êng ®−îc dïng thay thÕ cho nhau. Mét l−îng lín ADN tr×nh tù ®¬n gi¶n cña hÖ gen tËp trung ë c¸c ®Çu mót vµ t©m ®éng cña nhiÔm s¾c thÓ, cho thÊy nh÷ng tr×nh tù ADN nµy gi÷ vai trß cÊu tróc nhiÔm s¾c thÓ. C¸c tr×nh tù ADN t¹i t©m ®éng lµ thiÕt yÕu cho ho¹t ®éng ph©n ly cña c¸c nhiÔm s¾c tö trong qu¸ tr×nh ph©n bµo (xem Ch−¬ng 12). Tr×nh tù ADN t©m ®éng, cïng víi c¸c ADN tr×nh tù ®¬n gi¶n kh¸c, cã thÓ ®ãng vai trß tæ chøc chÊt nhiÔm s¾c trong nh©n t¹i kú trung gian cña chu tr×nh tÕ bµo. C¸c ADN tr×nh tù ®¬n gi¶n t¹i c¸c ®Çu mót nhiÔm s¾c thÓ gióp b¶o vÖ c¸c gen kh«ng bÞ mÊt do ADN ng¾n l¹i sau mçi lÇn sao chÐp (xem Ch−¬ng 16). ADN ®Çu mót ®ång thêi liªn kÕt víi c¸c protein gióp b¶o vÖ ®Çu mót nhiÔm s¾c thÓ khái bÞ biÕn tÝnh, ®ång thêi kh«ng bÞ dÝnh chËp víi c¸c nhiÔm s¾c thÓ kh¸c. C¸c gen vµ c¸c hä ®a gen Chóng ta kÕt thóc bµn luËn vÒ c¸c lo¹i tr×nh tù ADN kh¸c nhau trong c¸c hÖ gen sinh vËt nh©n thËt b»ng viÖc nh×n gÇn c¸c gen h¬n. Chóng ta nhí l¹i r»ng tæng céng c¸c tr×nh tù ADN m· hãa hoÆc cho c¸c protein hoÆc cho c¸c lo¹i tARN vµ rARN chØ chiÕm cã 1,5% hÖ gen ng−êi (xem H×nh 21.7). NÕu chóng ta tÝnh c¶ c¸c tr×nh tù intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn gen, th× tæng céng tÊt c¶ c¸c tr×nh tù ADN cã liªn quan ®Õn gen (bao gåm c¶ nh÷ng ®o¹n m· hãa vµ kh«ng m· hãa) chiÕm
  12. 12. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 437 kho¶ng 25% hÖ gen ng−êi. Nãi c¸ch kh¸c, trung b×nh chØ cã kho¶ng 6% (tøc lµ 1,5% cña 25%) tr×nh tù ®Çy ®ñ cña mét gen cã mÆt trong s¶n phÈm cuèi cïng cña gen. Gièng víi c¸c gen cña vi khuÈn, nhiÒu gen ë sinh vËt nh©n thËt lµ nh÷ng tr×nh tù ®¬n nhÊt vµ chØ cã mét b¶n sao duy nhÊt trong mçi bé nhiÔm s¾c thÓ ®¬n béi. Tuy vËy, trong hÖ gen ng−êi vµ hÖ gen cña nhiÒu ®éng vËt vµ thùc vËt kh¸c, nh÷ng gen “®¬n ®éc” nh− vËy chiÕm Ýt h¬n mét nöa tæng sè tr×nh tù ADN ®−îc phiªn m·. C¸c gen cßn l¹i xuÊt hiÖn thµnh c¸c hä ®a gen, tøc lµ tËp hîp cña hai hay nhiÒu gen gièng hÖt hoÆc rÊt gièng nhau. Trong c¸c hä ®a gen gåm c¸c tr×nh tù ADN gièng hÖt nhau, c¸c tr×nh tù ADN lÆp l¹i liÒn kÒ nhau, vµ ngo¹i trõ c¸c gen m· hãa protein histone, chóng m· hãa cho s¶n phÈm cuèi cïng lµ ARN. Mét vÝ dô vÒ hä c¸c tr×nh tù ADN gièng hÖt nhau lµ côm c¸c gen m· hãa cho ba lo¹i ph©n tö rARN lín nhÊt (H×nh 21.10a). Nh÷ng ph©n tö rARN nµy ®−îc phiªn m· thµnh c¸c b¶n phiªn m· duy nhÊt gåm hµng tr¨m thËm chÝ hµng ngh×n lÇn lÆp l¹i kÕ tiÕp nhau vµ tËp hîp thµnh mét hoÆc mét sè côm trong hÖ gen sinh vËt nh©n thËt. Víi nhiÒu b¶n sao cïng cã mÆt trong mét ®¬n vÞ phiªn m· nh− vËy, tÕ bµo cã thÓ nhanh chãng t¹o ra hµng triÖu ribosome cÇn cho qu¸ tr×nh tæng hîp protein. B¶n phiªn m· s¬ cÊp cña c¸c gen rARN sau ®ã ®−îc c¾t xÐn ®Ó h×nh thµnh nªn ba lo¹i ph©n tö rARN. Nh÷ng ph©n tö rARN nµy sau ®ã ®−îc kÕt hîp víi c¸c protein vµ mét lo¹i rARN kh¸c (rARN 5S) ®Ó t¹o nªn c¸c tiÓu phÇn ribosome. C¸c vÝ dô kinh ®iÓn vÒ c¸c hä ®a gen cã tr×nh tù kh«ng gièng hÖt nhau gåm hai hä gen cã quan hÖ víi nhau m· hãa cho globin; ®©y lµ mét nhãm c¸c protein gåm c¸c tiÓu phÇn (chuçi polypeptit) α vµ β cña hemoglobin. Cã mét hä gen n»m trªn NST sè 16 ë ng−êi m· hãa cho c¸c d¹ng kh¸c nhau cña α- globin; mét hä gen cßn l¹i n»m trªn NST sè 11 m· hãa cho c¸c d¹ng kh¸c nhau cña β-globin (H×nh 21.10b). C¸c d¹ng kh¸c nhau cña mçi tiÓu phÇn globin ®−îc biÓu hiÖn vµo c¸c thêi ®iÓm kh¸c nhau cña qu¸ tr×nh ph¸t triÓn, qua ®ã gióp hemoglobin biÓu hiÖn chøc n¨ng hiÖu qu¶ trong c¸c ®iÒu kiÖn m«i tr−êng thay ®æi trong qu¸ tr×nh ph¸t triÓn ë ®éng vËt. Ch¼ng h¹n nh−, ë ng−êi, c¸c d¹ng hemoglobin cã trong ph«i vµ thai cã ¸i lùc víi oxy cao h¬n so víi d¹ng hemoglobin ë ng−êi tr−ëng thµnh; ®iÒu nµy gióp ®¶m b¶o hiÖu qu¶ vËn chuyÓn oxy tõ mÑ sang thai nhi. Trong c¸c côm hä gen m· hãa globin, ng−êi ta cßn t×m thÊy mét sè gen gi¶. H×nh 21.10 C¸c hä gen. Trong phÇn (a) cña trªn h×nh, b»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh ®−îc chiÒu phiªn m·, nÕu nh− kh«ng cã mòi tªn mµu ®á? Nh©n hem Hä gen α-globin ADN Hä gen β-globin NhiÔm s¾c thÓ sè 16 NhiÔm s¾c thÓ sè 11 Ph«i Thai vµ ng−êi tr−ëng thµnh Ph«i Thai Ng−êi tr−ëng thµnh §o¹n ®Öm kh«ng ®−îc phiªn m· §¬n vÞ phiªn m· C¸c b¶n phiªn m· ARN ADN rARN (a) Mét phÇn hä gen m hãa ARN ribosom. Ba trong sè hµng tr¨m b¶n sao cña c¸c ®¬n vÞ phiªn m· rARN trong hÖ gen cña loµi kú gi«ng ®−îc minh häa ë phÇn trªn (¶nh TEM). Mçi mét “chiÕc l«ng” t−¬ng øng víi mét ®¬n vÞ phiªn m· víi kho¶ng 100 ph©n tö ®ang ®−îc tæng hîp bëi ARN polymerase (®iÓm mµu sÉm däc theo sîi ADN) dÞch chuyÓn tõ tr¸i qua ph¶i. C¸c b¶n phiªn m· ARN ®ang ®−îc “më réng” tõ ADN. S¬ ®å bªn d−íi ¶nh TEM m« t¶ mét ®¬n vÞ phiªn m·. Nã bao gåm c¸c gen (mµu xanh lam) m· hãa ba lo¹i rARN xen gi÷a c¸c vïng ®−îc phiªn m· nh−ng sau ®ã ®−îc c¾t bá (mµu vµng). Ban ®Çu chØ mét b¶n phiªn m· ARN duy nhÊt ®−îc t¹o ra, nh−ng sau ®ã nã ®−îc c¾t xÐn ®Ó t¹o nªn ba ph©n tö rARN kh¸c nhau (mçi lo¹i mét ph©n tö); chóng lµ c¸c thµnh phÇn thiÕt yÕu cña ribosom. Mét lo¹i rARN thø t− (5S rARN) còng lµ thµnh phÇn cña ribosom, nh−ng gen m· hãa nã kh«ng thuéc cïng ®¬n vÞ phiªn m· nµy. (b) C¸c hä gen α α α α-globin vµ β β β β-globin ë ng−êi. Hemoglobin ®−îc cÊu t¹o tõ hai tiÓu phÇn (chuçi) polypeptide lo¹i α-globin vµ hai tiÓu phÇn lo¹i β-globin. C¸c gen (mµu xanh lam) m· hãa cho α-globin vµ β-globin ®−îc t×m thÊy trong hai hä gen cã cÊu tróc tæ chøc nh− minh häa trªn h×nh. C¸c tr×nh tù ADN kh«ng m· hãa xen gi÷a c¸c gen chøc n¨ng trong mçi hä gen gåm c¸c gen gi¶ (mµu xanh lôc) vµ c¸c d¹ng biÕn ®æi kh«ng biÓu hiÖn chøc n¨ng cña c¸c gen chøc n¨ng b×nh th−êng. Tªn gäi c¸c gen vµ c¸c gen gi¶ ®−îc kÝ hiÖu vµ ®äc theo tiÕng Hy l¹p.
  13. 13. 438 khèi kiÕn thøc 3 Di truyÒn häc Sù s¾p xÕp c¸c gen thµnh c¸c hä gen ®· gióp c¸c nhµ sinh häc cã nh÷ng hiÓu biÕt s©u h¬n vÒ qu¸ tr×nh tiÕn hãa cña c¸c hÖ gen. Trong môc tiÕp theo, chóng ta sÏ ®Ò cËp ®Õn mét sè qu¸ tr×nh dÉn ®Õn sù ®Þnh h×nh c¸c hÖ gen cña c¸c loµi kh¸c nhau qua qu¸ tr×nh tiÕn hãa. C¬ së thay ®æi ë cÊp ®é hÖ gen lµ ®ét biÕn vµ ®ã còng lµ nÒn t¶ng cña tiÕn hãa häc hÖ gen. D−êng nh− nh÷ng d¹ng sèng ®Çu tiªn chØ chøa mét sè tèi thiÓu c¸c gen, nghÜa lµ chØ cã c¸c gen thiÕt yÕu cho sù tån t¹i vµ sinh s¶n. NÕu ®iÒu nµy lµ ®óng, th× mét chiÒu h−íng tiÕn hãa h¼n lµ ®· diÔn ra cïng víi sù t¨ng lªn vÒ kÝch th−íc hÖ gen, vµ vËt chÊt di truyÒn bæ sung ®· cung cÊp nguyªn liÖu s¬ cÊp cho tÝnh ®a d¹ng t¨ng lªn cña c¸c gen. Trong môc nµy, ®Çu tiªn chóng ta sÏ m« t¶ b»ng c¸ch nµo nh÷ng b¶n sao bæ sung cña toµn bé hay mét phÇn cña hÖ gen cã thÓ xuÊt hiÖn, råi sau ®ã ®Ò cËp ®Õn nh÷ng qu¸ tr×nh x¶y ra tiÕp theo dÉn ®Õn sù tiÕn hãa cña c¸c protein (hoÆc c¸c s¶n phÈm ARN) cã chøc n¨ng hoµn toµn míi hoÆc thay ®æi chót Ýt. Sù nh©n ®«i c¸c bé nhiÔm s¾c thÓ C¸c sù kiÖn ngÉu nhiªn trong gi¶m ph©n cã thÓ dÉn ®Õn tÕ bµo cã thÓ cã mét hoÆc nhiÒu bé nhiÔm s¾c thÓ bæ sung thªm; hiÖn t−îng nµy ®−îc gäi lµ ®a béi thÓ. MÆc dï, trong phÇn lín tr−êng hîp nh÷ng sù kiÖn ngÉu nhiªn ®ã th−êng g©y chÕt, nh−ng trong mét sè hiÕm tr−êng hîp, chóng l¹i thóc ®Èy sù tiÕn hãa cña c¸c gen. ë mét c¬ thÓ ®a béi, mét bé c¸c gen cã thÓ cung cÊp ®ñ c¸c chøc n¨ng thiÕt yÕu cho c¬ thÓ ®ã. Nh÷ng gen ë nh÷ng bé nhiÔm s¾c thÓ bæ sung cã thÓ ph©n ly bëi qu¸ tr×nh tÝch lòy c¸c ®ét biÕn; nh÷ng biÕn dÞ nµy cã thÓ ®−îc duy tr× nÕu nh− c¬ thÓ mang c¸c ®ét biÕn sèng sãt vµ sinh s¶n ®−îc. B»ng c¸ch ®ã, c¸c gen cã thÓ tiÕn hãa víi nh÷ng chøc n¨ng míi. Cïng víi viÖc mét b¶n sao cña gen thiÕt yÕu ®−îc biÓu hiÖn, sù ph©n ly cña mét b¶n sao kh¸c cã thÓ dÉn ®Õn mét lo¹i protein vÉn do gen ®ã m· hãa song ho¹t ®éng theo mét c¸ch míi, qua ®ã lµm thay ®æi kiÓu h×nh cña sinh vËt. KÕt qu¶ cña sù tÝch lòy c¸c ®ét biÕn nµy cã thÓ dÉn ®Õn sù ph©n nh¸nh tiÕn hãa cña mét loµi míi, gièng nh− biÓu hiÖn th−êng thÊy ë thùc vËt (xem Ch−¬ng 24). C¸c ®éng vËt ®a béi còng tån t¹i, song rÊt hiÕm. Sù thay ®æi cÊu tróc nhiÔm s¾c thÓ Tõ l©u c¸c nhµ khoa häc ®· biÕt r»ng vµo mét thêi ®iÓm nµo ®ã trong vßng 6 triÖu n¨m tr−íc khi c¸c d¹ng tæ tiªn cña ng−êi hiÖn ®¹i vµ tinh tinh ph©n ly khái nhau vµ h×nh thµnh nªn c¸c loµi riªng biÖt, mét sù dung hîp hai nhiÔm s¾c thÓ kh¸c nhau vèn cã ë d¹ng tæ tiªn ®· dÉn ®Õn loµi ng−êi cã sè nhiÔm s¾c thÓ ®¬n béi (n = 23) kh¸c víi cña tinh tinh (n = 24). Víi sù bïng næ th«ng tin vÒ tr×nh tù c¸c hÖ gen, giê ®©y chóng ta cã thÓ so s¸nh cÊu tróc vµ tæ chøc nhiÔm s¾c thÓ gi÷a nhiÒu loµi ë cÊp ®é ph©n tÝch chi tiÕt h¬n. Nh÷ng th«ng tin nµy gióp chóng ta cã thÓ t×m hiÓu s©u h¬n vÒ c¸c qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù h×nh thµnh c¸c nhiÔm s¾c thÓ còng nh− sù ph¸t sinh c¸c loµi. VÝ dô nh−, trong mét nghiªn cøu, c¸c nhµ khoa häc ®· tiÕn hµnh so s¸nh tr×nh tù ADN gi÷a mçi nhiÔm s¾c thÓ cña ng−êi víi tr×nh tù toµn bé hÖ gen cña chuét. H×nh 21.11 cho thÊy kÕt qu¶ so s¸nh víi nhiÔm s¾c thÓ sè 16 cña ng−êi lµ: nh÷ng “khèi” gen lín trªn nhiÔm s¾c thÓ nµy ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ kh¸c nhau cña chuét; ®iÒu nµy cho thÊy c¸c gen trong mçi “khèi” ®· tån t¹i cïng víi nhau trong qu¸ tr×nh tiÕn hãa cña 21.5 Kh¸i niÖm LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa 21.4 1. H·y nªu c¸c ®Æc ®iÓm cña hÖ gen ®éng vËt cã vó lµm chóng trë nªn lín h¬n so víi c¸c hÖ gen sinh vËt nh©n s¬? 2. C¸c intron, c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ph©n bè trong hÖ gen kh¸c nhau nh− thÕ nµo? 3. Nªu sù kh¸c nhau trong cÊu tróc cña c¸c hä gen m· hãa rARN vµ m· hãa c¸c protein globin ë ng−êi. Víi mçi hä gen, h·y gi¶i thÝch lîi thÕ cña sù tån t¹i cÊu tróc kiÓu hä gen ®èi víi sinh vËt. 4. Gi¶ sö b¹n t×m thÊy mét tr×nh tù ADN gièng víi tr×nh tù cña mét gen ®· biÕt, nh−ng chóng l¹i kh¸c nhau râ rÖt ë mét vµi nucleotide nhÊt ®Þnh. B»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh tr×nh tù míi t×m thÊy cã ph¶i lµ mét “gen” biÓu hiÖn chøc n¨ng hay kh«ng?? Xem gîi ý tr¶ lêi ë Phô lôc A. KiÓm tra kh¸i niÖm ®iÒu g× NÕu H×nh 21.11 C¸c khèi tr×nh tù gièng nhau trªn c¸c nhiÔm s¾c thÓ cña ng−êi vµ chuét. C¸c tr×nh tù ADN rÊt gièng nhau ®−îc t×m thÊy trong mét khèi tr×nh tù lín thuéc nhiÔm s¾c thÓ sè 16 cña ng−êi ®−îc t×m thÊy trªn c¸c nhiÔm s¾c thÓ sè 7, 8, 16 vµ 17 cña chuét. §iÒu nµy cho thÊy c¸c tr×nh tù ADN trong mçi khèi ®· lu«n tån t¹i cïng nhau ë c¸c dßng tiÕn hãa dÉn ®Õn sù h×nh thµnh ng−êi vµ chuét kÓ tõ thêi ®iÓm chóng ph©n ly khái nhau tõ tæ tiªn chung. NhiÔm s¾c thÓ sè 16 cña ng−êi C¸c khèi tr×nh tù ADN C¸c khèi tr×nh tù t−¬ng øng ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ cña chuét
  14. 14. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 439 chuét còng nh− ë c¸c nh¸nh tiÕn hãa cña ng−êi. Thùc hiÖn phÐp so s¸nh t−¬ng tù gi÷a nhiÔm s¾c thÓ cña ng−êi víi s¸u loµi ®éng vËt cã vó kh¸c còng ®· gióp c¸c nhµ nghiªn cøu t¸i thiÕt ®−îc lÞch sö tiÕn hãa tæ chøc nhiÔm s¾c thÓ ë t¸m loµi ®éng vËt cã vó nµy. Qua ®ã, c¸c nhµ nghiªn cøu ®· t×m ra nhiÒu lÆp ®o¹n vµ ®¶o ®o¹n trªn c¸c ph©n ®o¹n lín cña NST lµ kÕt qu¶ cña c¸c lçi t¸i tæ hîp x¶y ra trong gi¶m ph©n dÉn ®Õn sù ®øt g·y vµ nèi l¹i kh«ng chÝnh x¸c cña ADN. TÇn sè suÊt hiÖn nh÷ng sù kiÖn nµy d−êng nh− ®· t¨ng nhanh trong kho¶ng 100 triÖu n¨m tr−íc, tøc lµ kho¶ng thêi gian nh÷ng loµi khñng long kÝch th−íc lín trë nªn tuyÖt chñng vµ sè loµi ®éng vËt cã vó t¨ng lªn nhanh chãng. Sù trïng lÆp ngÉu nhiªn nµy râ rµng lµ rÊt thó vÞ bëi v× sù t¸i s¾p xÕp nhiÔm s¾c thÓ ®−îc cho lµ ®· ®ãng gãp vµo sù h×nh thµnh c¸c loµi míi. MÆc dï hai c¸ thÓ mang c¸c nhiÔm s¾c thÓ ®−îc s¾p xÕp kh¸c nhau vÉn cã thÓ giao phèi víi nhau vµ sinh s¶n, nh−ng c¸c c¸ thÓ con sinh ra sÏ cã hai bé nhiÔm s¾c thÓ kh«ng t−¬ng ®ång. V× vËy, sù s¾p xÕp l¹i c¸c nhiÔm s¾c thÓ cã thÓ dÉn ®Õn sù h×nh thµnh hai quÇn thÓ kh«ng cßn cã kh¶ n¨ng giao phèi víi nhau n÷a, vµ nã trë thµnh mét b−íc trong con ®−êng dÉn ®Õn sù h×nh thµnh hai loµi t¸ch biÖt (chóng ta sÏ ®Ò cËp kü h¬n vÒ vÊn ®Ò nµy ë Ch−¬ng 24). §iÒu g©y ng¹c nhiªn mét chót lµ nh÷ng nghiªn cøu t−¬ng tù ®· ph¸t hiÖn ra nh÷ng mèi liªn quan ®Õn y häc. ViÖc ph©n tÝch c¸c ®iÓm ®øt g·y nhiÔm s¾c thÓ liªn quan ®Õn sù t¸i s¾p xÕp cña chóng cho thÊy nh÷ng ®iÓm nµy kh«ng hÒ ph©n bè ngÉu nhiªn, mµ chóng lµ nh÷ng ®iÓm ®Æc thï ®−îc dïng ®i dïng l¹i nhiÒu lÇn. NhiÒu “®iÓm nãng” t¸i tæ hîp nh− vËy t−¬ng øng víi vÞ trÝ s¾p xÕp l¹i nhiÔm s¾c thÓ trong hÖ gen ng−êi vèn cã liªn quan ®Õn c¸c bÖnh bÈm sinh. TÊt nhiªn, c¸c nhµ nghiªn cøu cßn quan t©m c¶ nh÷ng vÞ trÝ kh¸c cã thÓ liªn quan ®Õn nh÷ng bÖnh cho ®Õn nay ch−a ®−îc x¸c ®Þnh. LÆp ®o¹n vµ sù ph©n ly cña c¸c vïng ADN cã kÝch th−íc t−¬ng øng víi gen C¸c lçi trong gi¶m ph©n còng cã thÓ dÉn ®Õn hiÖn t−îng lÆp c¸c vïng nhiÔm s¾c thÓ cã kÝch th−íc nhá h¬n nh÷ng vïng lÆp mµ chóng ta ®· ®Ò cËp trªn ®©y, trong ®ã bao gåm c¸c vïng t−¬ng øng víi chiÒu dµi cña c¸c gen ®¬n lÎ. Ch¼ng h¹n nh−, trao ®æi chÐo kh«ng c©n trong kú ®Çu gi¶m ph©n I cã thÓ dÉn ®Õn mét nhiÔm s¾c thÓ mÊt ®o¹n, trong khi mét nhiÔm s¾c thÓ kh¸c lÆp ®o¹n. Nh− minh häa trªn H×nh 21.12, c¸c yÕu tè vËn ®éng trong hÖ gen lµ nh÷ng vÞ trÝ mµ c¸c nhiÔm s¾c tö kh«ng chÞ em cã thÓ trao ®æi chÐo víi nhau, thËm chÝ ngay c¶ khi chóng kh«ng cã nh÷ng tr×nh t−¬ng ®ång xÕp th¼ng hµng chÝnh x¸c víi nhau. Ngoµi ra, hiÖn t−îng “tr−ît” cã thÓ x¶y ra trong sao chÐp ADN, ch¼ng h¹n nh− m¹ch lµm khu«n xª dÞch so víi m¹ch t−¬ng ®ång míi ®−îc tæng hîp, hoÆc mét phÇn cña m¹ch lµm khu«n bÞ bé m¸y sao chÐp bá qua hay trong tr−êng hîp kh¸c nã ®−îc dïng lµm khu«n hai lÇn. KÕt qu¶ lµ mét ph©n ®o¹n ADN bÞ mÊt ®i hoÆc lÆp l¹i. Cã thÓ dÔ dµng t−ëng t−îng ra c¸ch mµ nh÷ng lçi nh− vËy cã thÓ xuÊt hiÖn trong c¸c vïng tr×nh tù lÆp l¹i gièng nh− c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ®· ®−îc m« t¶ ë trªn. C¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n víi sè l−îng biÕn ®éng t¹i mét vÞ trÝ nhÊt ®Þnh, vèn ®−îc dïng cho ph©n tÝch STR, cã thÓ lµ do nh÷ng lçi gièng nh− vËy. C¸c b»ng chøng vÒ trao ®æi chÐo kh«ng c©n vµ hiÖn t−îng “tr−ît” cña m¹ch khu«n trong sao chÐp ADN dÉn ®Õn lÆp gen ®−îc t×m thÊy ë nhiÒu hä ®a gen tån t¹i trong c¸c hÖ gen hiÖn nay. Sù tiÕn hãa c¸c gen cã chøc n¨ng liªn quan víi nhau: C¸c gen globin ë ng−êi C¸c sù kiÖn lÆp ®o¹n nhiÔm s¾c thÓ hay lÆp gen cã thÓ dÉn ®Õn sù tiÕn hãa cña c¸c gen cã chøc n¨ng liªn quan ®Õn nhau, ch¼ng h¹n nh− c¸c hä gen m· hãa cho α-globin vµ β-globin (xem H×nh 21.10b). ViÖc so s¸nh c¸c tr×nh tù gen trong mét hä ®a gen cã thÓ chØ ra thø tù c¸c gen xuÊt hiÖn. C¸ch tiÕp cËn ®Ó “t¸i t¹o” l¹i lÞch sö tiÕn hãa cña c¸c gen m· hãa globin ®· chØ ra r»ng tÊt c¶ nh÷ng gen nµy ®Òu cã nguån gèc tõ mét gen globin tæ tiªn chung; gen tæ tiªn nµy ®· tr¶i qua hiÖn t−îng lÆp gen råi ph©n ly thµnh c¸c gen α-globin vµ β-globin tæ tiªn kho¶ng 450 - 500 triÖu n¨m tr−íc (H×nh 21.13, ë trang sau). Mçi gen tæ tiªn nµy sau ®ã tiÕp tôc ®−îc nh©n ®«i mét vµi lÇn, råi nh÷ng b¶n sao cña chóng ph©n ly khái nhau vÒ tr×nh tù, dÉn ®Õn h×nh thµnh c¸c gen thµnh viªn thuéc hä gen nh− hiÖn nay. Trong thùc tÕ, gen globin tæ tiªn chung còng cã thÓ lµ nguån gèc cña gen m· hãa protein c¬ liªn kÕt «xy cã tªn gäi lµ myoglobin vµ protein ë thùc vËt lµ leghemoglobin. Hai lo¹i protein nµy hoÆc ®éng ë d¹ng ®¬n ph©n, vµ c¸c gen cña chóng thuéc “siªu hä globin”. TiÕp theo sau c¸c sù kiÖn lÆp gen, sù kh¸c biÖt gi÷a c¸c gen trong c¸c hä globin râ rµng xuÊt ph¸t tõ c¸c ®ét biÕn ®−îc tÝch lòy trong c¸c b¶n sao cña gen qua nhiÒu thÕ hÖ. VÝ dô, mét m« h×nh hiÖn nay cho r»ng chøc n¨ng thiÕt yÕu cña protein α- globin tr−íc ®©y cã thÓ ®−îc ®¸p øng chØ bëi mét gen duy nhÊt, do vËy c¸c b¶n sao kh¸c cña gen α-globin ®· cã thÓ tÝch lòy c¸c ®ét biÕn ngÉu nhiªn. RÊt nhiÒu ®ét biÕn cã thÓ ®· g©y h¹i cho H×nh 21.12 LÆp gen do trao ®æi chÐo kh«ng c©n. Mét c¬ chÕ mµ qua ®ã mét gen (hoÆc mét ®o¹n ADN kh¸c) cã thÓ bÞ lÆp l¹i (nh©n ®«i) lµ sù t¸i tæ hîp x¶y ra trong qu¸ tr×nh gi¶m ph©n gi÷a c¸c b¶n sao kh¸c nhau cña mét yÕu tè vËn ®éng n»m s¸t vïng biªn cña c¸c gen. Sù t¸i tæ hîp nh− vËy x¶y ra do sù “s¾p hµng lÖch” cña hai nhiÔm s¾c tö kh«ng chÞ em thuéc cÆp nhiÔm s¾c thÓ t−¬ng ®ång dÉn ®Õn sù h×nh thµnh mét nhiÔm s¾c tö mang hai b¶n sao cña gen, trong khi nhiÔm s¾c tö cßn l¹i th× kh«ng cã b¶n sao nµo cña gen ®ã. YÕu tè vËn ®éng Gen C¸c nhiÔm s¾c tö kh«ng chÞ em VÞ trÝ trao ®æi chÐo Sù b¾t cÆp kh«ng chÝnh x¸c cña hai nhiÔm s¾c thÓ t−¬ng ®ång trong gi¶m ph©n vµ
  15. 15. 440 khèi kiÕn thøc 3 Di truyÒn häc c¬ thÓ sinh vËt, trong khi mét sè ®ét biÕn kh¸c kh«ng g©y hËu qu¶ g×, nh−ng cã mét sè Ýt ®ét biÕn h¼n lµ ®· lµm thay ®æi chøc n¨ng cña s¶n phÈm protein theo c¸ch cã lîi cho c¬ thÓ sinh vËt vµo mét giai ®o¹n sèng nhÊt ®Þnh cña nã ®ång thêi kh«ng lµm thay ®æi chøc n¨ng vËn chuyÓn «xy cña protein. Cã thÓ gi¶ thiÕt r»ng: chän läc tù nhiªn ®· t¸c ®éng lªn nh÷ng gen nµy vµ duy tr× chóng trong quÇn thÓ. Sù gièng nhau vÒ c¸c tr×nh tù axit amin cña c¸c chuçi polypeptit α-globin vµ β-globin ñng hé cho m« h×nh lÆp gen vµ tÝch lòy ®ét biÕn (B¶ng 21.2). Ch¼ng h¹n nh−, tr×nh tù axit amin cña c¸c β-globin gièng nhau h¬n rÊt nhiÒu so víi tr×nh tù cña α-globin. Sù tån t¹i cña mét sè gen gi¶ n»m gi÷a c¸c gen globin ho¹t ®éng lµ mét b»ng chøng bæ sung kh¸c ñng hé cho m« h×nh nµy (xem H×nh 21.10b). C¸c ®ét biÕn ngÉu nhiªn x¶y ra ë nh÷ng “gen” nµy qua thêi gian tiÕn hãa cã thÓ ®· lµm háng sù biÓu hiÖn chøc n¨ng b×nh th−êng cña chóng. TiÕn hãa cña c¸c gen cã chøc n¨ng míi Trong qu¸ tr×nh tiÕn hãa cña c¸c hä gen globin, hiÖn t−îng lÆp gen vµ ph©n ly sau ®ã ®· t¹o nªn c¸c gen thµnh viªn mµ s¶n phÈm cña chóng ®Òu thùc hiÖn chøc n¨ng gièng nhau (vËn chuyÓn «xy). Theo mét c¸ch kh¸c, mét b¶n sao cña gen ®−îc nh©n ®«i cã thÓ tr¶i qua nh÷ng biÕn ®æi dÉn ®Õn sù xuÊt hiÖn mét chøc n¨ng hoµn toµn míi cña s¶n phÈm protein. C¸c gen m· hãa lysozyme vµ α-lactalbumin lµ mét vÝ dô nh− vËy. Lysozyme lµ mét enzym gióp b¶o vÖ c¬ thÓ ®éng vËt khái sù l©y nhiÔm cña vi khuÈn b»ng viÖc xóc t¸c thñy ph©n thµnh tÕ bµo vi khuÈn; α-lactalbumin lµ mét protein kh«ng cã chøc n¨ng enzym, thay vµo ®ã nã gi÷ vai trß trong qu¸ tr×nh s¶n xuÊt s÷a ë ®éng vËt cã vó. Hai protein nµy rÊt gièng nhau vÒ tr×nh tù axit amin vµ cÊu tróc kh«ng gian ba chiÒu. C¶ hai gen ®−îc t×m thÊy ®ång thêi cã mÆt ë c¸c loµi ®éng vËt cã vó, nh−ng ë chim chØ t×m thÊy gen m· hãa lysozyme. §iÒu nµy chØ ra r»ng vµo mét thêi ®iÓm nhÊt ®Þnh nµo ®ã trong qu¸ khø, sau khi c¸c nh¸nh dÉn ®Õn h×nh thµnh c¸c loµi ®éng vËt cã vó vµ chim ph©n ly khái nhau, gen lysozyme ®· tr¶i qua mét sù kiÖn lÆp gen trong nh¸nh tiÕn hãa h×nh thµnh c¸c ®éng vËt cã x−¬ng sèng, nh−ng kh«ng x¶y ra trong nh¸nh tiÕn hãa cña chim. Cuèi cïng, mét b¶n sao cña gen lysozym ®· ®−îc nh©n ®«i dÉn ®Õn sù tiÕn hãa h×nh thµnh gen m· hãa α- lactanbomin vèn lµ mét protein cã chøc n¨ng kh¸c biÖt ho¹t toµn. Sù s¾p xÕp l¹i c¸c phÇn cña gen: nh©n ®«i vµ tr¸o exon Sù s¾p xÕp l¹i c¸c tr×nh tù ADN s½n cã trong c¸c gen còng ®· gãp phÇn vµo sù tiÕn hãa hÖ gen. Sù cã mÆt cña intron trong phÇn lín c¸c gen ë sinh vËt nh©n thËt ®a bµo cã thÓ ®· thóc ®Èy sù tiÕn hãa cña c¸c protein cã tiÒm n¨ng h÷u dông míi b»ng viÖc gia t¨ng hiÖn t−îng lÆp ®o¹n hay s¾p xÕp l¹i vÞ trÝ cña c¸c exon trong hÖ gen. Chóng ta nhí l¹i tõ Ch−¬ng 17 r»ng mçi exon th−êng m· hãa cho mét miÒn cã cÊu tróc vµ chøc n¨ng ®Æc thï cña protein. Chóng ta còng ®· biÕt trao ®æi chÐo kh«ng c©n trong qu¸ tr×nh gi¶m ph©n cã thÓ dÉn ®Õn hiÖn t−îng lÆp gen trªn mét nhiÔm s¾c thÓ ®ång thêi lµm mÊt gen trªn nhiÔm s¾c thÓ t−¬ng ®ång víi nã (xem H×nh 21.12). B»ng mét qu¸ tr×nh t−¬ng tù, mét exon nhÊt ®Þnh trong gen cã thÓ bÞ nh©n ®«i trªn mét nhiÔm s¾c thÓ, song l¹i bÞ mÊt ®i trªn nhiÔm s¾c thÓ kia. C¸c gen mang c¸c exon lÆp l¹i cã thÓ m· hãa cho mét lo¹i protein chøa hai b¶n sao cña mét miÒn protein. Sù thay ®æi nµy trong cÊu tróc cã thÓ lµm t¨ng c−êng sù biÓu hiÖn chøc n¨ng cña protein nÕu protein ®ã lóc nµy trë nªn æn ®Þnh h¬n, vµ t¨ng kh¶ n¨ng liªn kÕt víi mét chÊt g¾n nhÊt ®Þnh hoÆc lµm thay ®æi mét sè thuéc tÝnh kh¸c. Kh¸ nhiÒu gen m· H×nh 21.13 Mét m« h×nh tiÕn hãa cña c¸c hä gen α-globin vµ β-globin tõ gen globin “tæ tiªn” duy nhÊt. C¸c yÕu tè tr×nh tù mµu xanh lôc lµ c¸c gen gi¶. H·y gi¶i thÝch b»ng c¸ch nµo chóng cã thÓ xuÊt hiÖn sau khi ®· x¶y ra c¸c sù kiÖn lÆp gen. B¶ng 21.2 TØ lÖ gièng nhau trong tr×nh tù axit amin gi÷a c¸c protein globin ë ng−êi Gen globin “tæ tiªn” Gen “tæ tiªn” ®−îc nh©n ®«i (lÆp gen) §ét biÕn tÝch lòy ë c¶ hai b¶n sao VËn ®éng tíi c¸c nhiÔm s¾c thÓ kh¸c TiÕp tôc lÆp gen vµ tÝch lòy ®ét biÕn Hä gen α-globin trªn nhiÔm s¾c thÓ sè 16 Hä gen α-globin trªn nhiÔm s¾c thÓ sè 11 Thêi gian tiÕn hãa C¸c lo¹i α α α α-globin C¸c lo¹i β β β β-globin C¸c lo¹i α α α α-globin C¸c lo¹i β β β β-globin

×