SlideShare uma empresa Scribd logo
1 de 59
BBaassiicc CCoonncceeppttss ooff 
MM..AAllrrooyy MMaassccrreenngghhee 22 
 IInnttrroodduuccttiioonn 
 BBaassiicc ccoonncceeppttss iinn MMoolleeccuullaarr bbiioollooggyy 
 BBiiooiinnffoorrmmaattiiccss tteecchhnniiqquueess 
 AArreeaass iinn bbiiooiinnffoorrmmaattiiccss 
 AApppplliiccaattiioonnss 
 RReellaatteedd CCoommppuutteerr TTeecchhnnoollooggyy 
 CCoonnffeerreennccee iinn GGllaassggooww 
 AAcckknnoowwlleeddggeemmeennttss 
 RReeffeerreennccee
MM..AAllrrooyy MMaassccrreenngghhee 33
MM..AAllrrooyy MMaassccrreenngghhee 44 
 AA MMaajjoorr eevveenntt hhaappppeenneedd tthhaatt wwaass ttoo 
cchhaannggee tthhee ccoouurrssee ooff hhuummaann hhiissttoorryy 
 IItt wwaass aa jjooiinntt BBrriittiisshh aanndd AAmmeerriiccaann 
 nnootthhiinngg ttoo ddoo wwiitthh IIRRAAQQ!! 
 IItt wwaass aa rraaccee –– wwhhoo wwiillll ccoommpplleettee 
 RRaaccee TTeesstt –– nnoott wwhheetthheerr tthheeyy hhaavvee 
ttaakkeenn ddrruuggss bbuutt wwhheetthheerr tthheeyy ccaann 
pprroodduuccee tthheemm!! 
 HHuummaann ggeennoommee wwaass sseeqquueenncceedd
AA SSiittuu……ssoommeewwhheerree iinn tthhee 
nneeaarr ffuuttuurree 
 AA vviirruuss ––nnoott ‘‘II lloovvee yyoouu’’ vviirruuss-- ccrreeaatteess aann eeppiiddeemmiicc 
 GGeenneettiicciissttss aanndd bbiiooiinnffoorrmmaattiicciiaannss rroollee oonn tthheeiirr 
 GGeenneettiicc mmaatteerriiaall ooff tthhee vviirruuss iiss ccoommppaarreedd wwiitthh tthhee 
eexxiissttiinngg bbaassee ooff kknnoowwnn ggeenneettiicc mmaatteerriiaall ooff ootthheerr 
 AAss tthhee cchhaarraacctteerriissttiiccss ooff tthhee ootthheerr vviirruusseess aarree 
 FFrroomm ggeenneettiicc mmaatteerriiaall ccoommppuutteerr pprrooggrraammss wwiillll 
ddeerriivvee tthhee pprrootteeiinnss nneecceessssaarryy ffoorr tthhee ssuurrvviivvaall ooff tthhee 
 WWhheenn tthhee pprrootteeiinn ((sseeqquueennccee aanndd ssttrruuccttuurree)) iiss 
kknnoowwnn tthheenn mmeeddiicciinneess ccaann bbee ddeessiiggnneedd 
MM..AAllrrooyy MMaassccrreenngghhee 55
WWhhaatt iiss 
 TThhee mmaarrrriiaaggee bbeettwweeeenn ccoommppuutteerr 
sscciieennccee aanndd mmoolleeccuullaarr bbiioollooggyy 
 TThhee aallggoorriitthhmm aanndd tteecchhnniiqquueess ooff 
ccoommppuutteerr sscciieennccee aarree bbeeiinngg uusseedd ttoo 
ssoollvvee tthhee pprroobblleemmss ffaacceedd bbyy mmoolleeccuullaarr 
 ‘‘IInnffoorrmmaattiioonn tteecchhnnoollooggyy aapppplliieedd ttoo 
tthhee mmaannaaggeemmeenntt aanndd aannaallyyssiiss ooff 
bbiioollooggiiccaall ddaattaa’’ 
 SSttoorraaggee aanndd AAnnaallyyssiiss aarree ttwwoo ooff tthhee 
iimmppoorrttaanntt ffuunnccttiioonnss –– bbiiooiinnffoorrmmaattiicciiaannss 
bbuuiilldd ttoooollss ffoorr eeaacchh 
MM..AAllrrooyy MMaassccrreenngghhee 66
Biology Chemistry 
MM..AAllrrooyy MMaassccrreenngghhee 77
WWhhaatt iiss.... 
 TThhiiss iiss tthhee aaggee ooff tthhee IInnffoorrmmaattiioonn 
 HHoowweevveerr ssttoorriinngg iinnffoo iiss nnootthhiinngg nneeww 
 IInnffoorrmmaattiioonn ttoo tthhee vvoolluummee ooff 
BBrriittaannnniiccaa EEnnccyyccllooppeeddiiaa iiss ssttoorreedd iinn 
eeaacchh ooff oouurr cceellllss 
 ‘‘BBiiooiinnffoorrmmaattiiccss ttrriieess ttoo ddeetteerrmmiinnee 
wwhhaatt iinnffoo iiss bbiioollooggiiccaallllyy iimmppoorrttaanntt’’ 
MM..AAllrrooyy MMaassccrreenngghhee 88
MMoolleeccuullaarr BBiioollooggyy…….. 
MM..AAllrrooyy MMaassccrreenngghhee 99
DDNNAA && GGeenneess 
 DDNNAA iiss wwhheerree tthhee ggeenneettiicc iinnffoorrmmaattiioonn iiss 
 BBlloonnddee hhaaiirr aanndd bblluuee eeyyeess aarree iinnhheerriitteedd bbyy 
 GGeennee -- TThhee bbaassiicc uunniitt ooff hheerreeddiittyy 
 TThheerree aarree ggeenneess ffoorr cchhaarraacctteerriissttiiccss aa ggeennee 
ffoorr bblloonndd hhaaiirr eettcc 
 GGeenneess ccoonnttaaiinn tthhee iinnffoorrmmaattiioonn aass aa 
sseeqquueennccee ooff nnuucclleeoottiiddeess 
 GGeenneess aarree aabbssttrraacctt ccoonncceeppttss –– lliikkee 
lloonnggiittuuddee aanndd llaattiittuuddeess iinn tthhee sseennssee tthhaatt 
yyoouu ccaannnnoott sseeee tthheemm sseeppaarraatteellyy 
 GGeenneess aarree mmaaddee uupp ooff nnuucclleeoottiiddeess 
MM..AAllrrooyy MMaassccrreenngghhee 1100
MM..AAllrrooyy MMaassccrreenngghhee 1111
NNuucclleeoottiiddee ((nntt)) 
 EEaacchh nntt II mmaaddee uupp ooff 
 SSuuggaarr 
 PPhhoossppaattee ggrroouupp 
 BBaassee 
 TThhee bbaassee iitt ((nntt)) ccoonnttaaiinnss mmaakkeess tthhee oonnllyy 
ddiiffffeerreennccee bbeettwweeeenn oonnee nntt aanndd tthhee ootthheerr 
 TThheerree aarree 44 ddiiffffeerreenntt bbaasseess 
 GG((uuaanniinnee)),,AA((ddeenniinnee)),,TT((hhyymmiinnee)),,CC((yyttoossiinnee)) 
 TThhee iinnffoorrmmaattiioonn iiss iinn tthhee oorrddeerr ooff nnuucclleeoottiiddee 
aanndd tthhee oorrddeerr iiss tthhee iinnffoo 
 GGeenneess ccaann bbee mmaannyy tthhoouussaannddss ooff nntt lloonngg 
 TThhee ccoommpplleettee sseett ooff ggeenneettiicc iinnssttrruuccttiioonnss iiss 
ccaalllleedd ggeennoommeess 
MM..AAllrrooyy MMaassccrreenngghhee 1122
 DDNNAA ssttrriinnggss mmaakkee 
 AAnnaallooggyy 
LLeetttteerrss -- nntt 
SSeenntteenncceess –– ggeenneess 
IInnddiivviidduuaall vvoolluummeess ooff BBrriittaannnniiccaa 
eennccyyccllooppeeddiiaa –– cchhrroommoossoommeess 
AAllll vvoolleess ttooggeetthheerr -- GGeennoommee 
MM..AAllrrooyy MMaassccrreenngghhee 1133
DDoouubbllee HHeelliixx 
 TThhee DDNNAA iiss aa ddoouubbllee hheelliixx 
 EEaacchh ssttrraanndd hhaass ccoommpplleemmeennttaarryy 
 EEaacchh ppaarrttiiccuullaarr bbaassee iinn oonnee ssttrraanndd iiss 
bboonnddeedd wwiitthh aannootthheerr ppaarrttiiccuullaarr bbaassee iinn tthhee 
nneexxtt ssttrraanndd 
 GG -- CC 
 AA -- TT 
 FFoorr eexxaammppllee -- 
 AAAATTGGCC oonnee ssttrraanndd 
 TTTTAACCGG ootthheerr ssttrraanndd 
MM..AAllrrooyy MMaassccrreenngghhee 1144
 PPrrootteeiinnss aarree vveerryy iimmppoorrttaanntt 
bbiioollooggiiccaall ffeeaattuurree 
 AAmmiinnoo AAcciiddss mmaakkee uupp tthhee pprrootteeiinnss 
 2200 ddiiffffeerreenntt aammiinnoo aacciiddss aarree tthheerree 
 TThhee ffuunnccttiioonn ooff aa pprrootteeiinn iiss 
ddeeppeennddaanntt oonn tthhee oorrddeerr ooff tthhee aammiinnoo 
MM..AAllrrooyy MMaassccrreenngghhee 1155
 TThhee iinnffoorrmmaattiioonn rreeqquuiirreedd ttoo mmaakkee aaaa iiss 
ssttoorreedd iinn DDNNAA 
 DDNNAA sseeqquueennccee ddeetteerrmmiinneess aammiinnoo aacciidd 
 AAmmiinnoo AAcciidd sseeqquueennccee ddeetteerrmmiinneess pprrootteeiinn 
 PPrrootteeiinn ssttrruuccttuurree ddeetteerrmmiinneess pprrootteeiinn 
 AA SSuubbssttaannccee ccaalllleedd RRNNAA iiss uusseedd ttoo ccaarrrryy 
tthhee IInnffoo ssttoorreedd iinn tthhee DDNNAA tthhaatt iinn ttuurrnn iiss 
uusseedd ttoo mmaakkee pprrootteeiinnss 
 SSttoorraaggee -- DDNNAA 
 IInnffoorrmmaattiioonn TTrraannssffeerr –– RRNNAA 
 RRNNAA iiss tthhee mmeessssaaggee bbooyy!! 
MM..AAllrrooyy MMaassccrreenngghhee 1166
CCeennttrraall ddooggmmaa 
DDNNAA ttrraannssccrriippttiioonn RRNNAA TTrraannssllaattiioonn PPrrootteeiinn 
RRNNAA PPoollyymmeerraassee RRiibboossoommeess 
MM..AAllrrooyy MMaassccrreenngghhee 1177
MM..AAllrrooyy MMaassccrreenngghhee 1188
 SSiinnccee tthheerree aarree 2200 aammiinnoo aacciiddss ttoo 
ttrraannssllaattee oonnee nntt ccaannnnoott ccoorrrreessppoonndd 
ttoo oonnee aaaa,, nneeiitthheerr ccaann iitt ccoorrrreessppoonndd 
aass ttwwooss 
 SSoo iinn ttrriipplleett ccooddeess –– ccooddoonn –– pprrootteeiinn 
iinnffoorrmmaattiioonn iiss ccaarrrriieedd 
 TThhee ccooddoonnss tthhaatt ddoo nnoott ccoorrrreessppoonndd 
ttoo aa pprrootteeiinn aarree ssttoopp ccooddoonnss –– UUAAAA,, 
UUAAGG,, UUGGAA ((RRNNAA hhaass UU iinnsstteeaadd ooff TT)) 
 SSoommee ccooddoonnss aarree uusseedd aass ssttaarrtt 
ccooddoonnss -- AAUUGG aass wweellll aass ttoo ccooddee 
MM..AAllrrooyy MMaassccrreenngghhee 1199
PPrrootteeiinn SSttrruuccttuurree 
 SShhoowwss aa wwiiddee vvaarriieettyy aass ooppppoosseedd ttoo tthhee 
DDNNAA wwhhoossee ssttrruuccttuurree iiss uunniiffoorrmm 
 XX--rraayy ccrryyssttaallllooggrraapphhyy oorr NNuucclleeaarr MMaaggnneettiicc 
RReessoonnaannccee ((NNMMRR)) iiss uusseedd ttoo ffiigguurree oouutt tthhee 
 SSttrruuccttuurree iiss rreellaatteedd ttoo tthhee ffuunnccttiioonn oorr rraatthheerr 
ssttrruuccttuurree ddeetteerrmmiinneess tthhee ffuunnccttiioonn 
 AAlltthhoouugghh pprrootteeiinnss aarree ccrreeaatteedd aass aa lliinneeaarr 
ssttrruuccttuurree ooff aaaa cchhaaiinn tthheeyy ffoolldd iinnttoo 33 dd 
 IIff yyoouu ssttrreettcchh tthheemm aanndd lleeaavvee tthheemm tthheeyy wwiillll 
ggoo bbaacckk ttoo tthhiiss ssttrruuccttuurree –– tthhiiss iiss tthhee nnaattiivvee 
ssttrruuccttuurree ooff aa pprrootteeiinn 
 OOnnllyy iinn tthhee nnaattiivvee ssttrruuccttuurree tthhee pprrootteeiinnss 
ffuunnccttiioonnss wweellll 
 EEvveenn aafftteerr tthhee ttrraannssllaattiioonn iiss oovveerr pprrootteeiinn 
ggooeess tthhrroouugghh ssoommee cchhaannggeess ttoo iittss ssttrruuccttuurree 
MM..AAllrrooyy MMaassccrreenngghhee 2200
GGeennee EExxpprreessssiioonn 
 GGeennee EExxpprreessssiioonn –– tthhee pprroocceessss ooff 
TTrraannssccrriippttiinngg aa DDNNAA aanndd ttrraannssllaattiinngg aa RRNNAA 
ttoo mmaakkee pprrootteeiinn 
 WWhheerree ddoo tthhee ggeenneess bbeeggiinn iinn aa 
 HHooww ddooeess tthhee RRNNAA iiddeennttiiffyy tthhee bbeeggiinnnniinngg 
ooff aa ggeennee ttoo mmaakkee aa pprrootteeiinn 
 AA ssiinnggllee nntt ccaannnnoott bbee ttaakkeenn ttoo ppooiinntt oouutt tthhee 
bbeeggiinnnniinngg ooff aa ggeennee aass tthheeyy ooccccuurr 
 BBuutt aa ppaarrttiiccuullaarr ccoommbbiinnaattiioonn ooff aa nnuucclleeoottiiddee 
ccaann bbee 
 PPrroommootteerr sseeqquueenncceess –– tthhee oorrddeerr ooff nntt 
wwhhiicchh mmaarrkk tthhee bbeeggiinnnniinngg ooff aa ggeennee 
MM..AAllrrooyy MMaassccrreenngghhee 2211
MM..AAllrrooyy MMaassccrreenngghhee 2222
PPrreeddiiccttiioonn aanndd PPaatttteerrnn 
 TThhee ttwwoo mmaaiinn aarreeaass ooff bbiiooiinnffoorrmmaattiiccss 
 PPaatttteerrnn rreeccooggnniittiioonn 
 ‘‘AA ppaarrttiiccuullaarr sseeqquueennccee oorr ssttrruuccttuurree hhaass 
bbeeeenn sseeeenn bbeeffoorree’’ aanndd tthhaatt aa ppaarrttiiccuullaarr 
cchhaarraacctteerriissttiicc ccaann bbee aassssoocciiaatteedd wwiitthh iitt 
 PPrreeddiiccttiioonn 
 FFrroomm aa sseeqquueennccee ((wwhhaatt wwee kknnooww)) wwee 
ccaann pprreeddiicctt tthhee ssttrruuccttuurree aanndd ffuunnccttiioonn 
((wwhhaatt wwee ddoonn’’tt kknnooww)) 
MM..AAllrrooyy MMaassccrreenngghhee 2233
DDoott pplloottss…….. 
 SSiimmppllee wwaayy ooff eevvaalluuaattiinngg 
ssiimmiillaarriittyy bbeettwweeeenn ttwwoo 
 IInn aa ggrraapphh oonnee sseeqquueennccee iiss oonn 
oonnee ssiiddee tthhee nneexxtt oonn tthhee ootthheerr 
 WWhheerree tthheerree aarree mmaattcchheess 
bbeettwweeeenn tthhee ttwwoo sseeqquueenncceess tthhee 
ggrraapphh iiss mmaarrkkeedd 
MM..AAllrrooyy MMaassccrreenngghhee 2244
MM..AAllrrooyy MMaassccrreenngghhee 2255
 AA mmaattcchh ffoorr ssiimmiillaarriittyy bbeettwweeeenn tthhee cchhaarraacctteerrss ooff ttwwoo oorr 
mmoorree sseeqquueenncceess 
MM..AAllrrooyy MMaassccrreenngghhee 2266 
 EEgg.. 
 TThheerree aarree ssoo mmaannyy wwaayyss ttoo aalliiggnn tthhee aabboovvee ttwwoo 
 11.. 
 22.. 
 33.. 
 SSoo wwhhiicchh oonnee ddoo wwee cchhoooossee aanndd oonn wwhhaatt bbaassiiss?? 
 SSoolluuttiioonn iiss ttoo PPrroovviiddee aa mmaattcchh ssccoorree aanndd mmiissmmaattcchh ssccoorree
MM..AAllrrooyy MMaassccrreenngghhee 2277 
 IInnttrroodduuccee ggaappss aanndd aa ppeennaallttyy 
ssccoorree ffoorr ggaappss 
 IInn ggaapp ssccoorreess aa ssiinnggllee iinnddeell wwhhiicchh iiss ttwwoo cchhaarraacctteerrss lloonngg iiss pprreeffeerrrreedd ttoo ttwwoo iinnddeellss wwhhiicchh aarree eeaacchh oonnee 
cchhaarraacctteerr lloonngg 
 HHoowweevveerr nnoott aallll ggaappss aarree bbaadd 
 HHooww ddoo wwee aalliiggnn?? 
 ------CCAAAA------ 
 TThheessee ggaappss aarree nnoott bbiioollooggiiccaallllyy ssiiggnniiffiiccaanntt 
 SSeemmii GGlloobbaall AAlliiggnnmmeennttss
SSccoorriinngg MMaattrriixx 
 FFoorr DDNNAA//pprrootteeiinn sseeqquueennccee aalliiggnnmmeenntt wwee ccrreeaattee aa mmaattrriixx 
 IIff AA aanndd AA ssccoorree iiss 11 
 IIff AA aanndd TT ssccoorree iiss --55 
 IIff AA aanndd CC ssccoorree iiss --11 
MM..AAllrrooyy MMaassccrreenngghhee 2288
DDyynnaammiicc PPrrooggrraammmmiinngg 
 AAss tthhee lleennggtthh ooff tthhee qquueerryy sseeqquueenncceess 
iinnccrreeaassee aanndd tthhee ddiiffffeerreennccee ooff lleennggtthh 
bbeettwweeeenn tthhee ttwwoo sseeqquueennccee aallssoo iinnccrreeaasseess 
––mmoorree ggaappss hhaass ttoo bbee iinnsseerrtteedd iinn vvaarriioouuss 
 WWee ccaannnnoott ppeerrffoorrmm aann eexxhhaauussttiivvee sseeaarrcchh 
 CCoommbbiinnaattoorriiaall eexxpplloossiioonn ooccccuurrss –– ttoooo mmuucchh 
ccoommbbiinnaattiioonnss ttoo sseeaarrcchh ffoorr 
 DDyynnaammiicc pprrooggrraammmmiinngg iiss aa wwaayy ooff uussiinngg 
hheeuurriissttiiccss ttoo sseeaarrcchh iinn tthhee mmoosstt pprroommiissiinngg 
MM..AAllrrooyy MMaassccrreenngghhee 2299
 SSeeqquueennccee iinnffoo iiss ssttoorreedd iinn 
 SSoo tthhaatt tthheeyy ccaann bbee mmaanniippuullaatteedd 
 TThhee ddbb ((nneexxtt sslliiddee)) aarree llooccaatteedd 
aatt ddiiffff ppllaacceess 
 TThheeyy eexxcchhaannggee iinnffoo oonn aa ddaaiillyy 
bbaassiiss ssoo tthhaatt tthheeyy aarree uupp--ttoo--ddaattee 
aanndd aarree iinn ssyynncc 
 PPrriimmaarryy ddbb –– sseeqquueennccee ddaattaa 
MM..AAllrrooyy MMaassccrreenngghhee 3300
MMaajjoorr PPrriimmaarryy DDBB 
NNuucclleeiicc AAcciidd PPrrootteeiinn 
EEMMBBLL ((EEuurrooppee)) PPIIRR -- 
PPrrootteeiinn IInnffoorrmmaattiioonn 
UUnniivveerrssiittyy ooff GGeenneevvaa,, 
nnooww wwiitthh EEBBII 
AA ssuupppplleemmeenntt ttoo 
CCoommppoossiittee DDBB 
 AAss tthheerree aarree mmaannyy ddbb wwhhiicchh oonnee ttoo 
sseeaarrcchh?? SSoommee aarree ggoooodd iinn ssoommee 
aassppeeccttss aanndd wweeaakk iinn ootthheerrss?? 
 CCoommppoossiittee ddbb iiss tthhee aannsswweerr –– wwhhiicchh 
hhaass sseevveerraall ddbb ffoorr iittss bbaassee ddaattaa 
 SSeeaarrcchh oonn tthheessee ddbb iiss iinnddeexxeedd aanndd 
ssttrreeaammlliinneedd ssoo tthhaatt tthhee ssaammee ssttoorreedd 
sseeqquueennccee iiss nnoott sseeaarrcchheedd ttwwiiccee iinn 
ddiiffffeerreenntt ddbb 
MM..AAllrrooyy MMaassccrreenngghhee 3322
CCoommppoossiittee DDBB 
 OOWWLL hhaass tthheessee aass tthheeiirr pprriimmaarryy 
SSWWIISSSS PPRROOTT ((ttoopp pprriioorriittyy)) 
MM..AAllrrooyy MMaassccrreenngghhee 3333
SSeeccoonnddaarryy ddbb 
 SSttoorree sseeccoonnddaarryy ssttrruuccttuurree iinnffoo 
oorr rreessuullttss ooff sseeaarrcchheess ooff tthhee 
pprriimmaarryy ddbb 
MM..AAllrrooyy MMaassccrreenngghhee 3344
DDaattaabbaassee SSeeaarrcchheess 
 WWee hhaavvee sseeqquueenncceedd aanndd iiddeennttiiffiieedd 
ggeenneess.. SSoo wwee kknnooww wwhhaatt tthheeyy ddoo 
 TThhee sseeqquueenncceess aarree ssttoorreedd iinn 
 SSoo iiff wwee ffiinndd aa nneeww ggeennee iinn tthhee 
hhuummaann ggeennoommee wwee ccoommppaarree iitt wwiitthh 
tthhee aallrreeaaddyy ffoouunndd ggeenneess wwhhiicchh aarree 
ssttoorreedd iinn tthhee ddaattaabbaasseess.. 
 SSiinnccee tthheerree aarree llaarrggee nnuummbbeerr ooff 
ddaattaabbaasseess wwee ccaannnnoott ddoo sseeqquueennccee 
aalliiggnnmmeenntt ffoorr eeaacchh aanndd eevveerryy 
 SSoo hheeuurriissttiiccss mmuusstt bbee uusseedd aaggaaiinn.. 
MM..AAllrrooyy MMaassccrreenngghhee 3355
AArreeaass iinn 
MM..AAllrrooyy MMaassccrreenngghhee 3366
 BBeeccaauussee ooff tthhee mmuullttiicceelllluullaarr ssttrruuccttuurree,, eeaacchh 
cceellll ttyyppee ddooeess ggeennee eexxpprreessssiioonn iinn aa 
ddiiffffeerreenntt wwaayy ––aalltthhoouugghh eeaacchh cceellll hhaass tthhee 
ssaammee ccoonntteenntt aass ffaarr aass tthhee ggeenneettiicc 
 AAllll tthhee iinnffoorrmmaattiioonn ffoorr aa lliivveerr cceellll ttoo bbee aa 
lliivveerr cceellll iiss aallssoo pprreesseenntt oonn nnoossee cceellll,, ssoo 
ggeennee eexxpprreessssiioonn iiss tthhee oonnllyy tthhiinngg tthhaatt 
MM..AAllrrooyy MMaassccrreenngghhee 3377
GGeennoommiiccss -- FFiinnddiinngg GGeenneess 
 GGeennee iinn sseeqquueennccee ddaattaa –– nneeeeddllee iinn aa 
 HHoowweevveerr aass tthhee nneeeeddllee iiss ddiiffffeerreenntt 
ffrroomm tthhee hhaayyssttaacckk ggeenneess aarree nnoott ddiiffff 
ffrroomm tthhee rreesstt ooff tthhee sseeqquueennccee ddaattaa 
 IIss wwhhoollee aarrrraayy ooff nntt wwee ttrryy ttoo ffiinndd aanndd 
bboorrddeerr mmaarrkk aa sseett oo nntt aass aa ggeennee 
 TThhiiss iiss oonnee ooff tthhee cchhaalllleennggeess ooff 
 NNeeuurraall nneettwwoorrkkss aanndd ddyynnaammiicc 
pprrooggrraammmmiinngg aarree bbeeiinngg eemmppllooyyeedd 
MM..AAllrrooyy MMaassccrreenngghhee 3388
OOrrggaanniissmm GGeennoommee 
bbpp ** 11,,000000,,000000 
WWeebb SSiittee 
YYeeaasstt 1133..55 66,,224411 hhttttpp::////ggeennoommee-- 
FFrruuiitt FFlliieess 118800 1133,,660011 hhttttpp::////ffllyybbaassee..bbiioo.. 
33,,000000 4455,,000000 hhttttpp::////wwwwww..nnccbbii..nn 
 PPrrootteeoommee iiss tthhee ssuumm ttoottaall ooff aann 
oorrggaanniissmmss pprrootteeiinnss 
 MMoorree ddiiffffiiccuulltt tthhaann ggeennoommiiccss 
 44 2200 
 SSiimmppllee cchheemmiiccaall mmaakkeeuupp ccoommpplleexx 
 CCaann dduupplliiccaattee ccaann’’tt 
 WWee aarree eenntteerriinngg iinnttoo tthhee ‘‘ppoosstt 
ggeennoommee eerraa’’ 
 MMeeaanniinngg mmuucchh hhaass bbeeeenn ddoonnee wwiitthh 
tthhee GGeenneess –– nnoott tthhaatt iitt’’ss aa oovveerr 
MM..AAllrrooyy MMaassccrreenngghhee 4400
 TThhee rreellaattiioonnsshhiipp bbeettwweeeenn tthhee RRNNAA aanndd tthhee pprrootteeiinn iitt ccooddeess aarree 
uussuuaallllyy vveerryy ddiiffffeerreenntt 
 AAfftteerr ttrraannssllaattiioonn pprrootteeiinnss ddoo cchhaannggee 
 SSoo aaaa sseeqquueennccee ddoo nnoott tteellll aannyytthhiinngg aabboouutt tthhee ppoosstt 
ttrraannssllaattiioonn cchhaannggeess 
 PPrrootteeiinnss aarree nnoott aaccttiivvee uunnttiill tthheeyy aarree ccoommbbiinneedd iinnttoo aa llaarrggeerr 
ccoommpplleexx oorr mmoovveedd ttoo aa rreelleevvaanntt llooccaattiioonn iinnssiiddee oorr oouuttssiiddee tthhee cceellll 
 SSoo aaaa oonnllyy hhiinntt iinn tthheessee tthhiinnggss 
 AAllssoo pprrootteeiinnss mmuusstt bbee hhaannddlleedd mmoorree ccaarreeffuullllyy iinn llaabbss aass tthheeyy tteenndd 
ttoo cchhaannggee wwhheenn iinn ttoouucchh wwiitthh aann iinnaapppprroopprriiaattee mmaatteerriiaall 
MM..AAllrrooyy MMaassccrreenngghhee 4411
PPrrootteeiinn SSttrruuccttuurree PPrreeddiiccttiioonn 
 IIss oonnee ooff tthhee bbiiggggeesstt cchhaalllleennggeess 
ooff bbiiooiinnffoorrmmaattiiccss aanndd eesspp.. 
 NNoo aallggoorriitthhmm iiss tthheerree nnooww ttoo 
ccoonnssiisstteennttllyy pprreeddiicctt tthhee ssttrruuccttuurree 
ooff pprrootteeiinnss 
MM..AAllrrooyy MMaassccrreenngghhee 4422
SSttrruuccttuurree PPrreeddiiccttiioonn mmeetthhooddss 
 CCoommppaarraattiivvee MMooddeelliinngg 
TTaarrggeett pprrootteeiinnss ssttrruuccttuurree iiss 
ccoommppaarreedd wwiitthh rreellaatteedd pprrootteeiinnss 
PPrrootteeiinnss wwiitthh ssiimmiillaarr sseeqquueenncceess 
aarree sseeaarrcchheedd ffoorr ssttrruuccttuurreess 
MM..AAllrrooyy MMaassccrreenngghhee 4433
 TThhee ttaaxxoonnoommiiccaall ssyysstteemm rreefflleeccttss 
eevvoolluuttiioonnaarryy rreellaattiioonnsshhiippss 
 PPhhyyllooggeenneettiiccss ttrreeeess aarree tthhiinnggss wwhhiicchh rreefflleecctt 
tthhee eevvoolluuttiioonnaarryy rreellaattiioonnsshhiipp tthhrruu aa 
 RRooootteedd ttrreeeess wwhheerree tthheerree iiss oonnllyy oonnee 
 UUnn rrooootteedd ttrreeeess jjuusstt sshhoowwiinngg tthhee 
 PPhhyyllooggeenneettiicc ttrreeee rreeccoonnssttrruuccttiioonn aallggoorriitthhmmss 
aarree aallssoo aann aarreeaa ooff rreesseeaarrcchh 
MM..AAllrrooyy MMaassccrreenngghhee 4444
MM..AAllrrooyy MMaassccrreenngghhee 4455
MMeeddiiccaall IImmpplliiccaattiioonnss 
 PPhhaarrmmaaccooggeennoommiiccss 
 NNoott aallll ddrruuggss wwoorrkk oonn aallll ppaattiieennttss,, ssoommee ggoooodd 
ddrruuggss ccaauussee ddeeaatthh iinn ssoommee ppaattiieennttss 
 SSoo bbyy ddooiinngg aa ggeennee aannaallyyssiiss bbeeffoorree tthhee 
ttrreeaattmmeenntt tthhee ooffffeennssiivvee ddrruuggss ccaann bbee aavvooiiddeedd 
 AAllssoo ddrruuggss wwhhiicchh ccaauussee ddeeaatthh ttoo mmoosstt ccaann bbee 
uusseedd oonn aa mmiinnoorriittyy ttoo wwhhoossee ggeenneess tthhaatt ddrruugg iiss 
wweellll ssuuiitteedd –– vvoolluunntteeeerrss wwaanntteedd!! 
 CCuussttoommiizzeedd ttrreeaattmmeenntt 
 GGeennee TThheerraappyy 
 RReeppllaaccee oorr ssuuppppllyy tthhee ddeeffeeccttiivvee oorr mmiissssiinngg ggeennee 
 IInnssuulliinn aanndd FFaaccttoorr VVIIIIII oorr HHaaeemmoopphhiilliiaa 
 BBiiooWWeeaappoonnss ((????)) 
MM..AAllrrooyy MMaassccrreenngghhee 4466
DDiiaaggnnoossiiss ooff DDiisseeaassee 
 DDiiaaggnnoossiiss ooff ddiisseeaassee 
 IIddeennttiiffiiccaattiioonn ooff ggeenneess wwhhiicchh ccaauussee tthhee 
ddiisseeaassee wwiillll hheellpp ddeetteecctt ddiisseeaassee aatt eeaarrllyy 
ssttaaggee HHuunnttiinnggttoonn ddiisseeaassee -- 
 SSyymmppttoommss –– uunnccoonnttrroollllaabbllee ddaannccee lliikkee 
mmoovveemmeennttss,, mmeennttaall ddiissttuurrbbaannccee,, 
ppeerrssoonnaalliittyy cchhaannggeess aanndd iinntteelllleeccttuuaall 
 DDeeaatthh iinn 1100--1155 yyeeaarrss 
 TThhee ggeennee rreessppoonnssiibbllee ffoorr tthhee ddiisseeaassee hhaass 
bbeeeenn iiddeennttiiffiieedd 
 CCoonnttaaiinnss eexxcceessssiivveellyy rreeppeeaatteedd sseeccttiioonnss ooff 
 SSoo oonnccee aannaallyyzzeedd tthhee ccoouuppllee ccaann bbee 
MM..AAllrrooyy MMaassccrreenngghhee 4477
DDrruugg DDeessiiggnn 
 CCaann ggoo uupp ttoo 1155yyrrss aanndd 
 OOnnee ooff tthhee ggooaallss ooff 
bbiiooiinnffoorrmmaattiiccss iiss ttoo rreedduuccee tthhee 
ttiimmee aanndd ccoosstt iinnvvoollvveedd wwiitthh iitt.. 
 TThhee pprroocceessss 
 CCoommppuuttaattiioonnaall mmeetthhooddss ccaann 
iimmpprroovveess tthhiiss 
MM..AAllrrooyy MMaassccrreenngghhee 4488
TTaarrggeett iiddeennttiiffiiccaattiioonn 
 IIddeennttiiffyyiinngg tthhee mmoolleeccuullee oonn wwhhiicchh tthhee 
ggeerrmmss rreelliieess ffoorr iittss ssuurrvviivvaall 
 TThheenn wwee ddeevveelloopp aannootthheerr mmoolleeccuullee ddrruugg wwhhiicchh wwiillll bbiinndd ttoo tthhee ttaarrggeett 
 SSoo tthhee ggeerrmm wwiillll nnoott bbee aabbllee ttoo iinntteerraacctt 
wwiitthh tthhee ttaarrggeett.. 
 PPrrootteeiinnss aarree tthhee mmoosstt ccoommmmoonn ttaarrggeettss 
MM..AAllrrooyy MMaassccrreenngghhee 4499
 FFoorr eexxaammppllee HHIIVV pprroodduucceess HHIIVV 
pprrootteeaassee wwhhiicchh iiss aa pprrootteeiinn aanndd 
wwhhiicchh iinn ttuurrnn eeaatt ootthheerr pprrootteeiinnss 
 TThhiiss HHIIVV pprrootteeaassee hhaass aann aaccttiivvee 
ssiittee wwhheerree iitt bbiinnddss ttoo ootthheerr 
 SSoo HHIIVV ddrruugg wwiillll ggoo aanndd bbiinndd 
wwiitthh tthhaatt aaccttiivvee ssiittee 
EEaassiillyy ssaaiidd tthhaann ddoonnee!! 
MM..AAllrrooyy MMaassccrreenngghhee 5500
 LLeeaadd ccoommppoouunnddss aarree tthhee 
mmoolleeccuulleess tthhaatt ggoo aanndd bbiinndd ttoo 
tthhee ttaarrggeett pprrootteeiinn’’ss aaccttiivvee ssiittee 
 TTrraaddiittiioonnaallllyy tthhiiss hhaass bbeeeenn aa ttrriiaall 
aanndd eerrrroorr mmeetthhoodd 
 NNooww tthhiiss iiss bbeeiinngg mmoovveedd iinnttoo tthhee 
rreeaallmm ooff ccoommppuutteerrss 
MM..AAllrrooyy MMaassccrreenngghhee 5511
RReellaatteedd CCoommppuutteerr 
MM..AAllrrooyy MMaassccrreenngghhee 5522
MM..AAllrrooyy MMaassccrreenngghhee 5533 
 PPeerrll iiss ccoommmmoonnllyy uusseedd ffoorr 
bbiiooiinnffoorrmmaattiiccss ccaallccuullaattiioonnss aass iittss 
aabbiilliittyy ttoo mmaanniippuullaattee cchhaarraacctteerr 
 TThhee ddeeffaauulltt CCGGII llaanngguuaaggee 
 IItt ssttaarrtteedd oouutt aass aa ssccrriippttiinngg llaanngguuaaggee 
bbuutt hhaass bbeeccoommee aa ffuullllyy fflleeddggeedd 
 IITT hhaass eevveerryytthhiinngg nnooww,, eevveenn wweebb 
sseerrvviiccee ssuuppppoorrtt 
 hhttttpp::////bbiioo..ppeerrll..oorrgg
TThhee ppllaaccee ooff XXMMLL && WWeebb 
 VVaarriioouuss mmaarrkkuupp llaanngguuaaggeess aarree bbeeiinngg ccrreeaatteedd –– 
GGeennee MMaarrkkuupp llaanngguuaaggee eettcc ttoo rreepprreesseenntt 
sseeqquueennccee//ggeennee ddaattaa 
 WWeebb SSeerrvviicceess –– pprrooggrraamm ttoo pprrooggrraamm iinntteerraaccttiioonn,, 
mmaakkiinngg tthhee wweebb aapppplliiccaattiioonn cceennttrriicc aass ooppppoosseedd ttoo 
hhuummaann cceennttrriicc 
 SSoo tthhiiss hhaass ttoo ppllaattffoorrmm llaanngguuaaggee iinnddeeppeennddeenntt 
 PPrroottooccoollss lliikkee SSOOAAPP hheellpp iinn tthhiiss rreeggaarrdd 
 IInn bbiiooiinnffoorrmmaattiiccss vvaarriioouuss ddaattaabbaasseess aarree bbeeiinngg uusseedd,, 
ddiiffffeerreenntt ppllaattffoorrmmss,, llaanngguuaaggeess eettcc 
 SSoo wweebb sseerrvviicceess hheellppss aacchhiieevvee ppllaattffoorrmm 
iinnddeeppeennddeennccee aanndd pprrooggrraamm iinntteerraaccttiioonn 
 SSiinnccee sseeqquueennccee ddaattaa bbaasseess aarree iinn vvaarriioouuss ffoorrmmaattss,, 
ppllaattffoorrmmss SSOOAAPP aallssoo hheellppss iinn tthhiiss rreeggaarrddss 
MM..AAllrrooyy MMaassccrreenngghhee 5544
TThhee ppllaaccee ooff GGRRIIDD 
 GGRRIIDD -- nneeww kkiidd oonn tthhee bblloocckk 
 UUssiinngg mmaannyy ccoommppuutteerrss ttoo ffuullffiillll 
aa ssiinnggllee ccoommppuuttaattiioonnaall ttaasskkss 
 BBiiooiinnffoorrmmaattiiccss iiss tthhee iiddeeaall 
ppllaattffoorrmm aass iitt hhaass ttoo ddeeaall wwiitthh aa 
llaarrggee aammoouunntt ooff ddaattaa iinn 
aalliiggnnmmeenntt aanndd sseeaarrcchheess 
 EE--sscciieennccee iinniittiiaattiivvee iinn tthhee UUKK 
 OORRAACCLLEE 1100gg –– tthhee wwoorrllddss ffiirrsstt 
GGRRIIDD ddaattaabbaassee 
MM..AAllrrooyy MMaassccrreenngghhee 5555
DDaattaa bbaasseess aanndd MMiinniinngg 
 LLoott ooff tthhee sseeqquueennccee ddaattaabbaasseess aarree 
aavvaaiillaabbllee ppuubblliiccllyy 
 AAss tthheerree iiss aa DDBB iinnvvoollvveedd vvaarriioouuss 
ddaattaa mmiinniinngg tteecchhnniiqquueess aarree uusseedd ttoo 
ppuullll tthhee ddaattaa oouutt 
 AAss tthheerree iiss aa lloott ooff lliitteerraattuurree –– aarrttiicclleess 
eettcc –– oonn tthhiiss aarreeaa aa ddaattaa mmiinniinngg oonn 
tthhee lliitteerraattuurree –– nnoott oonn tthhee sseeqquueennccee 
ddaattaa hhaass aallssoo bbeeccoommee aa PPhhDD ttooppiicc 
ffoorr mmaannyy 
MM..AAllrrooyy MMaassccrreenngghhee 5566
EEuurrooppeeaann MMoolleeccuullaarr BBiioollooggyy 
NNeettwwoorrkk ((EEMMBBnneett)) 
 AA cceennttrraall ssyysstteemm ffoorr sshhaarriinngg,, ttrraaiinniinngg 
aanndd cceennttrraalliizziinngg uupp ttoo ddaattee bbiioo iinnffoo 
 SSoommee ooff tthhee EEMMBBnneett ssiitteess aarree:: 
 hhttttpp::////wwwwww..sseeqqnneett..ddll..aacc..uukk 
MM..AAllrrooyy MMaassccrreenngghhee 5577 
 hhttttpp::////wwwwww..bbiioocchheemm..uuccll..aacc..uukk//bbssmm//ddbbbbrroowwsseerr// EEBBII –– EEuurrooppeeaann BBiiooiinnffoorrmmaattiiccss 
 wwwwww..eebbii..aacc..uukk
 DDaann EE.. KKrraannee aanndd MMiicchhaaeell LL.. RRaayymmeerr 
 BBaassiicc CCoonncceeppttss ooff BBiiooiinnffoorrmmaattiiccss 
 AArrtthhuurr MM LLeesskk 
 IInnttrroo ttoo BBiiooiinnffoorrmmaattiiccss 
 TT..KK.. AAttttwwoooodd && DD.. J.. PPaarrrryy--SSmmiitthh 
 IInnttrroo ttoo BBiiooiinnffoorrmmaattiiccss 
 TThhee ggeenneettiicc RReevvoolluuttiioonn 
 DDrr PPaattrriicckk DDiixxoonn 
 PPrrooff DDaavviidd GGiillbbeerrtt’’ss SSiittee 
MM..AAllrrooyy MMaassccrreenngghhee 5588
TThhaannkk YYoouu!! 
MM..AAllrrooyy MMaassccrreenngghhee 5599

Mais conteúdo relacionado

Mais procurados

Aqua Eagles Presentation August 25th 2014
Aqua Eagles Presentation August 25th 2014 Aqua Eagles Presentation August 25th 2014
Aqua Eagles Presentation August 25th 2014
Adewoye Omoniyi

Mais procurados (20)

Aqua Eagles Presentation August 25th 2014
Aqua Eagles Presentation August 25th 2014 Aqua Eagles Presentation August 25th 2014
Aqua Eagles Presentation August 25th 2014
Cursos Polilab - Degradação e estabilização de polímeros aula 02
Cursos Polilab - Degradação e estabilização de polímeros aula 02Cursos Polilab - Degradação e estabilização de polímeros aula 02
Cursos Polilab - Degradação e estabilização de polímeros aula 02
Penetration testing: A proactive approach to secure computing - Eric Vanderbu...
Penetration testing: A proactive approach to secure computing - Eric Vanderbu...Penetration testing: A proactive approach to secure computing - Eric Vanderbu...
Penetration testing: A proactive approach to secure computing - Eric Vanderbu...
Ageing male
Ageing maleAgeing male
Ageing male
Geriatric depression
Geriatric depressionGeriatric depression
Geriatric depression
Activity 3 axial skeleton
Activity 3 axial skeletonActivity 3 axial skeleton
Activity 3 axial skeleton
Rehab for sick_units
Rehab for sick_unitsRehab for sick_units
Rehab for sick_units
Requerimientos energéticos 2014
Requerimientos energéticos 2014Requerimientos energéticos 2014
Requerimientos energéticos 2014
Industrialisasi Media
Industrialisasi MediaIndustrialisasi Media
Industrialisasi Media
#4 natural foods and supplement for gi health
#4  natural foods and supplement for gi health#4  natural foods and supplement for gi health
#4 natural foods and supplement for gi health
#10 inflammatory bowel disease
#10 inflammatory bowel disease#10 inflammatory bowel disease
#10 inflammatory bowel disease
#6 digestive system general maintenance and disorders
#6 digestive system general maintenance and disorders#6 digestive system general maintenance and disorders
#6 digestive system general maintenance and disorders
#7 dysbiosis and leaky gut syndrome
#7 dysbiosis and leaky gut syndrome#7 dysbiosis and leaky gut syndrome
#7 dysbiosis and leaky gut syndrome
Powder metallurgy
Powder metallurgyPowder metallurgy
Powder metallurgy
1334006 mitali
1334006 mitali1334006 mitali
1334006 mitali
Exploracion fisica miembros inferiores
Exploracion fisica miembros inferioresExploracion fisica miembros inferiores
Exploracion fisica miembros inferiores
Presentasi Presentasi
Exploracion fisica de miembro superior
Exploracion fisica de miembro superiorExploracion fisica de miembro superior
Exploracion fisica de miembro superior

Semelhante a Bioinformatics

Anupama Nagaraja
Asma bronquial
Asma bronquialAsma bronquial
Asma bronquial
An introduction to emerging branches of science
An introduction to emerging branches of science An introduction to emerging branches of science
An introduction to emerging branches of science
Rahul Reghu
Caso clínico Malaria
Caso clínico MalariaCaso clínico Malaria
Caso clínico Malaria
Juan Hoz
Osteo osteomalacia ricket2
Osteo osteomalacia ricket2Osteo osteomalacia ricket2
Osteo osteomalacia ricket2
padli ahmad
Creative commons and the ethical use of images in language instruction shelton
Creative commons and the ethical use of images in language instruction sheltonCreative commons and the ethical use of images in language instruction shelton
Creative commons and the ethical use of images in language instruction shelton
Donna Shelton

Semelhante a Bioinformatics (20)

Training methods
Training methodsTraining methods
Training methods
Mobile restaurant by titu
Mobile restaurant by tituMobile restaurant by titu
Mobile restaurant by titu
Asma bronquial
Asma bronquialAsma bronquial
Asma bronquial
debishis (3)
debishis (3)debishis (3)
debishis (3)
The right of children to free and compulsory education act, 2009
The right of children to free and compulsory education act, 2009The right of children to free and compulsory education act, 2009
The right of children to free and compulsory education act, 2009
Symmetry and group theory
Symmetry and group theorySymmetry and group theory
Symmetry and group theory
Electric vehicle charging station
Electric vehicle charging stationElectric vehicle charging station
Electric vehicle charging station
Nursing lec 1
Nursing lec 1Nursing lec 1
Nursing lec 1
An introduction to emerging branches of science
An introduction to emerging branches of science An introduction to emerging branches of science
An introduction to emerging branches of science
Application of An Artificial Neural Network
Application of An Artificial Neural Network Application of An Artificial Neural Network
Application of An Artificial Neural Network
Caso clínico Malaria
Caso clínico MalariaCaso clínico Malaria
Caso clínico Malaria
cv 2017
cv 2017cv 2017
cv 2017
Non drug treatment for hypertension
Non drug treatment for hypertensionNon drug treatment for hypertension
Non drug treatment for hypertension
Osteo osteomalacia ricket2
Osteo osteomalacia ricket2Osteo osteomalacia ricket2
Osteo osteomalacia ricket2
Christianity and the roman decline
Christianity and the roman declineChristianity and the roman decline
Christianity and the roman decline
Fluid & electrolytes & acid base
Fluid & electrolytes & acid baseFluid & electrolytes & acid base
Fluid & electrolytes & acid base
Creative commons and the ethical use of images in language instruction shelton
Creative commons and the ethical use of images in language instruction sheltonCreative commons and the ethical use of images in language instruction shelton
Creative commons and the ethical use of images in language instruction shelton


  • 1. BBaassiicc CCoonncceeppttss ooff BBiiooiinnffoorrmmaattiiccss SSUURRIIYYAA..RR RROOLLLL::NNOO::113399773300882288 KKUUCCTTEE KKOOLLLLAAMM hhttttpp::////wwwwww..ggeeoocciittiieess..ccoomm//mmaarrkk__aaii//
  • 2. MM..AAllrrooyy MMaassccrreenngghhee 22 TTOOCC  IInnttrroodduuccttiioonn  BBaassiicc ccoonncceeppttss iinn MMoolleeccuullaarr bbiioollooggyy  BBiiooiinnffoorrmmaattiiccss tteecchhnniiqquueess  AArreeaass iinn bbiiooiinnffoorrmmaattiiccss  AApppplliiccaattiioonnss  RReellaatteedd CCoommppuutteerr TTeecchhnnoollooggyy  CCoonnffeerreennccee iinn GGllaassggooww  AAcckknnoowwlleeddggeemmeennttss  RReeffeerreennccee
  • 4. MM..AAllrrooyy MMaassccrreenngghhee 44 22000000  AA MMaajjoorr eevveenntt hhaappppeenneedd tthhaatt wwaass ttoo cchhaannggee tthhee ccoouurrssee ooff hhuummaann hhiissttoorryy  IItt wwaass aa jjooiinntt BBrriittiisshh aanndd AAmmeerriiccaann eeffffoorrtt  nnootthhiinngg ttoo ddoo wwiitthh IIRRAAQQ!!  IItt wwaass aa rraaccee –– wwhhoo wwiillll ccoommpplleettee ffiirrsstt  RRaaccee TTeesstt –– nnoott wwhheetthheerr tthheeyy hhaavvee ttaakkeenn ddrruuggss bbuutt wwhheetthheerr tthheeyy ccaann pprroodduuccee tthheemm!!  HHuummaann ggeennoommee wwaass sseeqquueenncceedd
  • 5. AA SSiittuu……ssoommeewwhheerree iinn tthhee nneeaarr ffuuttuurree  AA vviirruuss ––nnoott ‘‘II lloovvee yyoouu’’ vviirruuss-- ccrreeaatteess aann eeppiiddeemmiicc  GGeenneettiicciissttss aanndd bbiiooiinnffoorrmmaattiicciiaannss rroollee oonn tthheeiirr sslleeeevveess  GGeenneettiicc mmaatteerriiaall ooff tthhee vviirruuss iiss ccoommppaarreedd wwiitthh tthhee eexxiissttiinngg bbaassee ooff kknnoowwnn ggeenneettiicc mmaatteerriiaall ooff ootthheerr vviirruusseess  AAss tthhee cchhaarraacctteerriissttiiccss ooff tthhee ootthheerr vviirruusseess aarree kknnoowwnn  FFrroomm ggeenneettiicc mmaatteerriiaall ccoommppuutteerr pprrooggrraammss wwiillll ddeerriivvee tthhee pprrootteeiinnss nneecceessssaarryy ffoorr tthhee ssuurrvviivvaall ooff tthhee vviirruuss  WWhheenn tthhee pprrootteeiinn ((sseeqquueennccee aanndd ssttrruuccttuurree)) iiss kknnoowwnn tthheenn mmeeddiicciinneess ccaann bbee ddeessiiggnneedd MM..AAllrrooyy MMaassccrreenngghhee 55
  • 6. WWhhaatt iiss  TThhee mmaarrrriiaaggee bbeettwweeeenn ccoommppuutteerr sscciieennccee aanndd mmoolleeccuullaarr bbiioollooggyy  TThhee aallggoorriitthhmm aanndd tteecchhnniiqquueess ooff ccoommppuutteerr sscciieennccee aarree bbeeiinngg uusseedd ttoo ssoollvvee tthhee pprroobblleemmss ffaacceedd bbyy mmoolleeccuullaarr bbiioollooggiissttss  ‘‘IInnffoorrmmaattiioonn tteecchhnnoollooggyy aapppplliieedd ttoo tthhee mmaannaaggeemmeenntt aanndd aannaallyyssiiss ooff bbiioollooggiiccaall ddaattaa’’  SSttoorraaggee aanndd AAnnaallyyssiiss aarree ttwwoo ooff tthhee iimmppoorrttaanntt ffuunnccttiioonnss –– bbiiooiinnffoorrmmaattiicciiaannss bbuuiilldd ttoooollss ffoorr eeaacchh MM..AAllrrooyy MMaassccrreenngghhee 66
  • 7. Biology Chemistry Statistics Computer Science Bioinformatics MM..AAllrrooyy MMaassccrreenngghhee 77
  • 8. WWhhaatt iiss....  TThhiiss iiss tthhee aaggee ooff tthhee IInnffoorrmmaattiioonn TTeecchhnnoollooggyy  HHoowweevveerr ssttoorriinngg iinnffoo iiss nnootthhiinngg nneeww  IInnffoorrmmaattiioonn ttoo tthhee vvoolluummee ooff BBrriittaannnniiccaa EEnnccyyccllooppeeddiiaa iiss ssttoorreedd iinn eeaacchh ooff oouurr cceellllss  ‘‘BBiiooiinnffoorrmmaattiiccss ttrriieess ttoo ddeetteerrmmiinnee wwhhaatt iinnffoo iiss bbiioollooggiiccaallllyy iimmppoorrttaanntt’’ MM..AAllrrooyy MMaassccrreenngghhee 88
  • 9. BBaassiiccss ooff MMoolleeccuullaarr BBiioollooggyy…….. MM..AAllrrooyy MMaassccrreenngghhee 99
  • 10. DDNNAA && GGeenneess  DDNNAA iiss wwhheerree tthhee ggeenneettiicc iinnffoorrmmaattiioonn iiss ssttoorreedd  BBlloonnddee hhaaiirr aanndd bblluuee eeyyeess aarree iinnhheerriitteedd bbyy tthhiiss  GGeennee -- TThhee bbaassiicc uunniitt ooff hheerreeddiittyy  TThheerree aarree ggeenneess ffoorr cchhaarraacctteerriissttiiccss aa ggeennee ffoorr bblloonndd hhaaiirr eettcc  GGeenneess ccoonnttaaiinn tthhee iinnffoorrmmaattiioonn aass aa sseeqquueennccee ooff nnuucclleeoottiiddeess  GGeenneess aarree aabbssttrraacctt ccoonncceeppttss –– lliikkee lloonnggiittuuddee aanndd llaattiittuuddeess iinn tthhee sseennssee tthhaatt yyoouu ccaannnnoott sseeee tthheemm sseeppaarraatteellyy  GGeenneess aarree mmaaddee uupp ooff nnuucclleeoottiiddeess MM..AAllrrooyy MMaassccrreenngghhee 1100
  • 12. NNuucclleeoottiiddee ((nntt))  EEaacchh nntt II mmaaddee uupp ooff  SSuuggaarr  PPhhoossppaattee ggrroouupp  BBaassee  TThhee bbaassee iitt ((nntt)) ccoonnttaaiinnss mmaakkeess tthhee oonnllyy ddiiffffeerreennccee bbeettwweeeenn oonnee nntt aanndd tthhee ootthheerr  TThheerree aarree 44 ddiiffffeerreenntt bbaasseess  GG((uuaanniinnee)),,AA((ddeenniinnee)),,TT((hhyymmiinnee)),,CC((yyttoossiinnee))  TThhee iinnffoorrmmaattiioonn iiss iinn tthhee oorrddeerr ooff nnuucclleeoottiiddee aanndd tthhee oorrddeerr iiss tthhee iinnffoo  GGeenneess ccaann bbee mmaannyy tthhoouussaannddss ooff nntt lloonngg  TThhee ccoommpplleettee sseett ooff ggeenneettiicc iinnssttrruuccttiioonnss iiss ccaalllleedd ggeennoommeess MM..AAllrrooyy MMaassccrreenngghhee 1122
  • 13. CChhrroommoossoommeess  DDNNAA ssttrriinnggss mmaakkee cchhrroommoossoommeess  AAnnaallooggyy LLeetttteerrss -- nntt SSeenntteenncceess –– ggeenneess IInnddiivviidduuaall vvoolluummeess ooff BBrriittaannnniiccaa eennccyyccllooppeeddiiaa –– cchhrroommoossoommeess AAllll vvoolleess ttooggeetthheerr -- GGeennoommee MM..AAllrrooyy MMaassccrreenngghhee 1133
  • 14. DDoouubbllee HHeelliixx  TThhee DDNNAA iiss aa ddoouubbllee hheelliixx  EEaacchh ssttrraanndd hhaass ccoommpplleemmeennttaarryy iinnffoorrmmaattiioonn  EEaacchh ppaarrttiiccuullaarr bbaassee iinn oonnee ssttrraanndd iiss bboonnddeedd wwiitthh aannootthheerr ppaarrttiiccuullaarr bbaassee iinn tthhee nneexxtt ssttrraanndd  GG -- CC  AA -- TT  FFoorr eexxaammppllee --  AAAATTGGCC oonnee ssttrraanndd  TTTTAACCGG ootthheerr ssttrraanndd MM..AAllrrooyy MMaassccrreenngghhee 1144
  • 15. PPrrootteeiinnss  PPrrootteeiinnss aarree vveerryy iimmppoorrttaanntt bbiioollooggiiccaall ffeeaattuurree  AAmmiinnoo AAcciiddss mmaakkee uupp tthhee pprrootteeiinnss  2200 ddiiffffeerreenntt aammiinnoo aacciiddss aarree tthheerree  TThhee ffuunnccttiioonn ooff aa pprrootteeiinn iiss ddeeppeennddaanntt oonn tthhee oorrddeerr ooff tthhee aammiinnoo aacciiddss MM..AAllrrooyy MMaassccrreenngghhee 1155
  • 16. PPrrootteeiinnss……  TThhee iinnffoorrmmaattiioonn rreeqquuiirreedd ttoo mmaakkee aaaa iiss ssttoorreedd iinn DDNNAA  DDNNAA sseeqquueennccee ddeetteerrmmiinneess aammiinnoo aacciidd sseeqquueennccee  AAmmiinnoo AAcciidd sseeqquueennccee ddeetteerrmmiinneess pprrootteeiinn ssttrruuccttuurree  PPrrootteeiinn ssttrruuccttuurree ddeetteerrmmiinneess pprrootteeiinn ffuunnccttiioonn  AA SSuubbssttaannccee ccaalllleedd RRNNAA iiss uusseedd ttoo ccaarrrryy tthhee IInnffoo ssttoorreedd iinn tthhee DDNNAA tthhaatt iinn ttuurrnn iiss uusseedd ttoo mmaakkee pprrootteeiinnss  SSttoorraaggee -- DDNNAA  IInnffoorrmmaattiioonn TTrraannssffeerr –– RRNNAA  RRNNAA iiss tthhee mmeessssaaggee bbooyy!! MM..AAllrrooyy MMaassccrreenngghhee 1166
  • 17. CCeennttrraall ddooggmmaa DDNNAA ttrraannssccrriippttiioonn RRNNAA TTrraannssllaattiioonn PPrrootteeiinn RRNNAA PPoollyymmeerraassee RRiibboossoommeess MM..AAllrrooyy MMaassccrreenngghhee 1177
  • 19. PPrrootteeiinnss……....  SSiinnccee tthheerree aarree 2200 aammiinnoo aacciiddss ttoo ttrraannssllaattee oonnee nntt ccaannnnoott ccoorrrreessppoonndd ttoo oonnee aaaa,, nneeiitthheerr ccaann iitt ccoorrrreessppoonndd aass ttwwooss  SSoo iinn ttrriipplleett ccooddeess –– ccooddoonn –– pprrootteeiinn iinnffoorrmmaattiioonn iiss ccaarrrriieedd  TThhee ccooddoonnss tthhaatt ddoo nnoott ccoorrrreessppoonndd ttoo aa pprrootteeiinn aarree ssttoopp ccooddoonnss –– UUAAAA,, UUAAGG,, UUGGAA ((RRNNAA hhaass UU iinnsstteeaadd ooff TT))  SSoommee ccooddoonnss aarree uusseedd aass ssttaarrtt ccooddoonnss -- AAUUGG aass wweellll aass ttoo ccooddee mmeetthhiioonniinnee MM..AAllrrooyy MMaassccrreenngghhee 1199
  • 20. PPrrootteeiinn SSttrruuccttuurree  SShhoowwss aa wwiiddee vvaarriieettyy aass ooppppoosseedd ttoo tthhee DDNNAA wwhhoossee ssttrruuccttuurree iiss uunniiffoorrmm  XX--rraayy ccrryyssttaallllooggrraapphhyy oorr NNuucclleeaarr MMaaggnneettiicc RReessoonnaannccee ((NNMMRR)) iiss uusseedd ttoo ffiigguurree oouutt tthhee ssttrruuccttuurree  SSttrruuccttuurree iiss rreellaatteedd ttoo tthhee ffuunnccttiioonn oorr rraatthheerr ssttrruuccttuurree ddeetteerrmmiinneess tthhee ffuunnccttiioonn  AAlltthhoouugghh pprrootteeiinnss aarree ccrreeaatteedd aass aa lliinneeaarr ssttrruuccttuurree ooff aaaa cchhaaiinn tthheeyy ffoolldd iinnttoo 33 dd ssttrruuccttuurree..  IIff yyoouu ssttrreettcchh tthheemm aanndd lleeaavvee tthheemm tthheeyy wwiillll ggoo bbaacckk ttoo tthhiiss ssttrruuccttuurree –– tthhiiss iiss tthhee nnaattiivvee ssttrruuccttuurree ooff aa pprrootteeiinn  OOnnllyy iinn tthhee nnaattiivvee ssttrruuccttuurree tthhee pprrootteeiinnss ffuunnccttiioonnss wweellll  EEvveenn aafftteerr tthhee ttrraannssllaattiioonn iiss oovveerr pprrootteeiinn ggooeess tthhrroouugghh ssoommee cchhaannggeess ttoo iittss ssttrruuccttuurree MM..AAllrrooyy MMaassccrreenngghhee 2200
  • 21. GGeennee EExxpprreessssiioonn  GGeennee EExxpprreessssiioonn –– tthhee pprroocceessss ooff TTrraannssccrriippttiinngg aa DDNNAA aanndd ttrraannssllaattiinngg aa RRNNAA ttoo mmaakkee pprrootteeiinn  WWhheerree ddoo tthhee ggeenneess bbeeggiinn iinn aa cchhrroommoossoommee??  HHooww ddooeess tthhee RRNNAA iiddeennttiiffyy tthhee bbeeggiinnnniinngg ooff aa ggeennee ttoo mmaakkee aa pprrootteeiinn  AA ssiinnggllee nntt ccaannnnoott bbee ttaakkeenn ttoo ppooiinntt oouutt tthhee bbeeggiinnnniinngg ooff aa ggeennee aass tthheeyy ooccccuurr ffrreeqquueennttllyy  BBuutt aa ppaarrttiiccuullaarr ccoommbbiinnaattiioonn ooff aa nnuucclleeoottiiddee ccaann bbee  PPrroommootteerr sseeqquueenncceess –– tthhee oorrddeerr ooff nntt wwhhiicchh mmaarrkk tthhee bbeeggiinnnniinngg ooff aa ggeennee MM..AAllrrooyy MMaassccrreenngghhee 2211
  • 23. PPrreeddiiccttiioonn aanndd PPaatttteerrnn RReeccooggnniittiioonn  TThhee ttwwoo mmaaiinn aarreeaass ooff bbiiooiinnffoorrmmaattiiccss aarree  PPaatttteerrnn rreeccooggnniittiioonn  ‘‘AA ppaarrttiiccuullaarr sseeqquueennccee oorr ssttrruuccttuurree hhaass bbeeeenn sseeeenn bbeeffoorree’’ aanndd tthhaatt aa ppaarrttiiccuullaarr cchhaarraacctteerriissttiicc ccaann bbee aassssoocciiaatteedd wwiitthh iitt  PPrreeddiiccttiioonn  FFrroomm aa sseeqquueennccee ((wwhhaatt wwee kknnooww)) wwee ccaann pprreeddiicctt tthhee ssttrruuccttuurree aanndd ffuunnccttiioonn ((wwhhaatt wwee ddoonn’’tt kknnooww)) MM..AAllrrooyy MMaassccrreenngghhee 2233
  • 24. DDoott pplloottss……..  SSiimmppllee wwaayy ooff eevvaalluuaattiinngg ssiimmiillaarriittyy bbeettwweeeenn ttwwoo sseeqquueenncceess  IInn aa ggrraapphh oonnee sseeqquueennccee iiss oonn oonnee ssiiddee tthhee nneexxtt oonn tthhee ootthheerr ssiiddee  WWhheerree tthheerree aarree mmaattcchheess bbeettwweeeenn tthhee ttwwoo sseeqquueenncceess tthhee ggrraapphh iiss mmaarrkkeedd MM..AAllrrooyy MMaassccrreenngghhee 2244
  • 26. AAlliiggnnmmeennttss  AA mmaattcchh ffoorr ssiimmiillaarriittyy bbeettwweeeenn tthhee cchhaarraacctteerrss ooff ttwwoo oorr mmoorree sseeqquueenncceess MM..AAllrrooyy MMaassccrreenngghhee 2266  EEgg..  TTTTAACCTTAATTAA  TTAAGGAATTAA  TThheerree aarree ssoo mmaannyy wwaayyss ttoo aalliiggnn tthhee aabboovvee ttwwoo sseeqquueenncceess  11..  TTTTAACCTTAATTAA  TTAAGGAATTAA  22..  TTTTAACCTTAATTAA  TTAAGGAATTAA  33..  TTTTAACCTTAATTAA  TTAAGGAATTAA  SSoo wwhhiicchh oonnee ddoo wwee cchhoooossee aanndd oonn wwhhaatt bbaassiiss??  SSoolluuttiioonn iiss ttoo PPrroovviiddee aa mmaattcchh ssccoorree aanndd mmiissmmaattcchh ssccoorree
  • 27. MM..AAllrrooyy MMaassccrreenngghhee 2277 GGaappss  IInnttrroodduuccee ggaappss aanndd aa ppeennaallttyy ssccoorree ffoorr ggaappss  TTTTAACCTTAATTAA  TT__AA__GGAATTAA  IInn ggaapp ssccoorreess aa ssiinnggllee iinnddeell wwhhiicchh iiss ttwwoo cchhaarraacctteerrss lloonngg iiss pprreeffeerrrreedd ttoo ttwwoo iinnddeellss wwhhiicchh aarree eeaacchh oonnee cchhaarraacctteerr lloonngg  HHoowweevveerr nnoott aallll ggaappss aarree bbaadd  TTTTGGCCAAAATTCCTT  CCAAAA  HHooww ddoo wwee aalliiggnn??  ------CCAAAA------  TThheessee ggaappss aarree nnoott bbiioollooggiiccaallllyy ssiiggnniiffiiccaanntt  SSeemmii GGlloobbaall AAlliiggnnmmeennttss
  • 28. SSccoorriinngg MMaattrriixx  FFoorr DDNNAA//pprrootteeiinn sseeqquueennccee aalliiggnnmmeenntt wwee ccrreeaattee aa mmaattrriixx  IIff AA aanndd AA ssccoorree iiss 11  IIff AA aanndd TT ssccoorree iiss --55  IIff AA aanndd CC ssccoorree iiss --11 MM..AAllrrooyy MMaassccrreenngghhee 2288
  • 29. DDyynnaammiicc PPrrooggrraammmmiinngg  AAss tthhee lleennggtthh ooff tthhee qquueerryy sseeqquueenncceess iinnccrreeaassee aanndd tthhee ddiiffffeerreennccee ooff lleennggtthh bbeettwweeeenn tthhee ttwwoo sseeqquueennccee aallssoo iinnccrreeaasseess ––mmoorree ggaappss hhaass ttoo bbee iinnsseerrtteedd iinn vvaarriioouuss ppllaacceess  WWee ccaannnnoott ppeerrffoorrmm aann eexxhhaauussttiivvee sseeaarrcchh  CCoommbbiinnaattoorriiaall eexxpplloossiioonn ooccccuurrss –– ttoooo mmuucchh ccoommbbiinnaattiioonnss ttoo sseeaarrcchh ffoorr  DDyynnaammiicc pprrooggrraammmmiinngg iiss aa wwaayy ooff uussiinngg hheeuurriissttiiccss ttoo sseeaarrcchh iinn tthhee mmoosstt pprroommiissiinngg ppaatthh MM..AAllrrooyy MMaassccrreenngghhee 2299
  • 30. DDaattaabbaasseess  SSeeqquueennccee iinnffoo iiss ssttoorreedd iinn ddaattaabbaasseess  SSoo tthhaatt tthheeyy ccaann bbee mmaanniippuullaatteedd eeaassiillyy  TThhee ddbb ((nneexxtt sslliiddee)) aarree llooccaatteedd aatt ddiiffff ppllaacceess  TThheeyy eexxcchhaannggee iinnffoo oonn aa ddaaiillyy bbaassiiss ssoo tthhaatt tthheeyy aarree uupp--ttoo--ddaattee aanndd aarree iinn ssyynncc  PPrriimmaarryy ddbb –– sseeqquueennccee ddaattaa MM..AAllrrooyy MMaassccrreenngghhee 3300
  • 31. MMaajjoorr PPrriimmaarryy DDBB NNuucclleeiicc AAcciidd PPrrootteeiinn EEMMBBLL ((EEuurrooppee)) PPIIRR -- PPrrootteeiinn IInnffoorrmmaattiioonn RReessoouurrccee GGeennBBaannkk ((UUSSAA)) MMIIPPSS DDDDBBJJ ((JJaappaann)) SSWWIISSSS--PPRROOTT UUnniivveerrssiittyy ooff GGeenneevvaa,, nnooww wwiitthh EEBBII TTrrEEMMBBLL AA ssuupppplleemmeenntt ttoo SSWWIISSSS--PPRROOTT NNRRLL--33DD
  • 32. CCoommppoossiittee DDBB  AAss tthheerree aarree mmaannyy ddbb wwhhiicchh oonnee ttoo sseeaarrcchh?? SSoommee aarree ggoooodd iinn ssoommee aassppeeccttss aanndd wweeaakk iinn ootthheerrss??  CCoommppoossiittee ddbb iiss tthhee aannsswweerr –– wwhhiicchh hhaass sseevveerraall ddbb ffoorr iittss bbaassee ddaattaa  SSeeaarrcchh oonn tthheessee ddbb iiss iinnddeexxeedd aanndd ssttrreeaammlliinneedd ssoo tthhaatt tthhee ssaammee ssttoorreedd sseeqquueennccee iiss nnoott sseeaarrcchheedd ttwwiiccee iinn ddiiffffeerreenntt ddbb MM..AAllrrooyy MMaassccrreenngghhee 3322
  • 33. CCoommppoossiittee DDBB  OOWWLL hhaass tthheessee aass tthheeiirr pprriimmaarryy ddbb SSWWIISSSS PPRROOTT ((ttoopp pprriioorriittyy)) PPIIRR GGeennBBaannkk NNRRLL--33DD MM..AAllrrooyy MMaassccrreenngghhee 3333
  • 34. SSeeccoonnddaarryy ddbb  SSttoorree sseeccoonnddaarryy ssttrruuccttuurree iinnffoo oorr rreessuullttss ooff sseeaarrcchheess ooff tthhee pprriimmaarryy ddbb CCoommppoo PPrriimmaarryy DDBB SSoouurrccee PPRROOSSIITTEE SSWWIISSSS--PPRROOTT PPRRIINNTTSS OOWWLL MM..AAllrrooyy MMaassccrreenngghhee 3344
  • 35. DDaattaabbaassee SSeeaarrcchheess  WWee hhaavvee sseeqquueenncceedd aanndd iiddeennttiiffiieedd ggeenneess.. SSoo wwee kknnooww wwhhaatt tthheeyy ddoo  TThhee sseeqquueenncceess aarree ssttoorreedd iinn ddaattaabbaasseess  SSoo iiff wwee ffiinndd aa nneeww ggeennee iinn tthhee hhuummaann ggeennoommee wwee ccoommppaarree iitt wwiitthh tthhee aallrreeaaddyy ffoouunndd ggeenneess wwhhiicchh aarree ssttoorreedd iinn tthhee ddaattaabbaasseess..  SSiinnccee tthheerree aarree llaarrggee nnuummbbeerr ooff ddaattaabbaasseess wwee ccaannnnoott ddoo sseeqquueennccee aalliiggnnmmeenntt ffoorr eeaacchh aanndd eevveerryy sseeqquueennccee  SSoo hheeuurriissttiiccss mmuusstt bbee uusseedd aaggaaiinn.. MM..AAllrrooyy MMaassccrreenngghhee 3355
  • 36. AArreeaass iinn BBiiooiinnffoorrmmaattiiccss…… MM..AAllrrooyy MMaassccrreenngghhee 3366
  • 37. GGeennoommiiccss  BBeeccaauussee ooff tthhee mmuullttiicceelllluullaarr ssttrruuccttuurree,, eeaacchh cceellll ttyyppee ddooeess ggeennee eexxpprreessssiioonn iinn aa ddiiffffeerreenntt wwaayy ––aalltthhoouugghh eeaacchh cceellll hhaass tthhee ssaammee ccoonntteenntt aass ffaarr aass tthhee ggeenneettiicc  AAllll tthhee iinnffoorrmmaattiioonn ffoorr aa lliivveerr cceellll ttoo bbee aa lliivveerr cceellll iiss aallssoo pprreesseenntt oonn nnoossee cceellll,, ssoo ggeennee eexxpprreessssiioonn iiss tthhee oonnllyy tthhiinngg tthhaatt ddiiffffeerreennttiiaatteess MM..AAllrrooyy MMaassccrreenngghhee 3377
  • 38. GGeennoommiiccss -- FFiinnddiinngg GGeenneess  GGeennee iinn sseeqquueennccee ddaattaa –– nneeeeddllee iinn aa hhaayyssttaacckk  HHoowweevveerr aass tthhee nneeeeddllee iiss ddiiffffeerreenntt ffrroomm tthhee hhaayyssttaacckk ggeenneess aarree nnoott ddiiffff ffrroomm tthhee rreesstt ooff tthhee sseeqquueennccee ddaattaa  IIss wwhhoollee aarrrraayy ooff nntt wwee ttrryy ttoo ffiinndd aanndd bboorrddeerr mmaarrkk aa sseett oo nntt aass aa ggeennee  TThhiiss iiss oonnee ooff tthhee cchhaalllleennggeess ooff bbiiooiinnffoorrmmaattiiccss  NNeeuurraall nneettwwoorrkkss aanndd ddyynnaammiicc pprrooggrraammmmiinngg aarree bbeeiinngg eemmppllooyyeedd MM..AAllrrooyy MMaassccrreenngghhee 3388
  • 39. OOrrggaanniissmm GGeennoommee SSiizzee ((MMbb)) bbpp ** 11,,000000,,000000 GGeennee NNuummbbeerr WWeebb SSiittee YYeeaasstt 1133..55 66,,224411 hhttttpp::////ggeennoommee-- wwwwww..ssttaannffoorrdd..eedd uu//SSaacccchhaarroommyyccee ss FFrruuiitt FFlliieess 118800 1133,,660011 hhttttpp::////ffllyybbaassee..bbiioo.. iinnddiiaannaa..eedduu HHoommoo SSaappiieennss 33,,000000 4455,,000000 hhttttpp::////wwwwww..nnccbbii..nn llmm..nniihh..ggoovv//ggeennoo mmee//gguuiiddee
  • 40. PPrrootteeoommiiccss  PPrrootteeoommee iiss tthhee ssuumm ttoottaall ooff aann oorrggaanniissmmss pprrootteeiinnss  MMoorree ddiiffffiiccuulltt tthhaann ggeennoommiiccss  44 2200  SSiimmppllee cchheemmiiccaall mmaakkeeuupp ccoommpplleexx  CCaann dduupplliiccaattee ccaann’’tt  WWee aarree eenntteerriinngg iinnttoo tthhee ‘‘ppoosstt ggeennoommee eerraa’’  MMeeaanniinngg mmuucchh hhaass bbeeeenn ddoonnee wwiitthh tthhee GGeenneess –– nnoott tthhaatt iitt’’ss aa oovveerr MM..AAllrrooyy MMaassccrreenngghhee 4400
  • 41. PPrrootteeoommiiccss……....  TThhee rreellaattiioonnsshhiipp bbeettwweeeenn tthhee RRNNAA aanndd tthhee pprrootteeiinn iitt ccooddeess aarree uussuuaallllyy vveerryy ddiiffffeerreenntt  AAfftteerr ttrraannssllaattiioonn pprrootteeiinnss ddoo cchhaannggee  SSoo aaaa sseeqquueennccee ddoo nnoott tteellll aannyytthhiinngg aabboouutt tthhee ppoosstt ttrraannssllaattiioonn cchhaannggeess  PPrrootteeiinnss aarree nnoott aaccttiivvee uunnttiill tthheeyy aarree ccoommbbiinneedd iinnttoo aa llaarrggeerr ccoommpplleexx oorr mmoovveedd ttoo aa rreelleevvaanntt llooccaattiioonn iinnssiiddee oorr oouuttssiiddee tthhee cceellll  SSoo aaaa oonnllyy hhiinntt iinn tthheessee tthhiinnggss  AAllssoo pprrootteeiinnss mmuusstt bbee hhaannddlleedd mmoorree ccaarreeffuullllyy iinn llaabbss aass tthheeyy tteenndd ttoo cchhaannggee wwhheenn iinn ttoouucchh wwiitthh aann iinnaapppprroopprriiaattee mmaatteerriiaall MM..AAllrrooyy MMaassccrreenngghhee 4411
  • 42. PPrrootteeiinn SSttrruuccttuurree PPrreeddiiccttiioonn  IIss oonnee ooff tthhee bbiiggggeesstt cchhaalllleennggeess ooff bbiiooiinnffoorrmmaattiiccss aanndd eesspp.. bbiioocchheemmiissttrryy  NNoo aallggoorriitthhmm iiss tthheerree nnooww ttoo ccoonnssiisstteennttllyy pprreeddiicctt tthhee ssttrruuccttuurree ooff pprrootteeiinnss MM..AAllrrooyy MMaassccrreenngghhee 4422
  • 43. SSttrruuccttuurree PPrreeddiiccttiioonn mmeetthhooddss  CCoommppaarraattiivvee MMooddeelliinngg TTaarrggeett pprrootteeiinnss ssttrruuccttuurree iiss ccoommppaarreedd wwiitthh rreellaatteedd pprrootteeiinnss PPrrootteeiinnss wwiitthh ssiimmiillaarr sseeqquueenncceess aarree sseeaarrcchheedd ffoorr ssttrruuccttuurreess MM..AAllrrooyy MMaassccrreenngghhee 4433
  • 44. PPhhyyllooggeenneettiiccss  TThhee ttaaxxoonnoommiiccaall ssyysstteemm rreefflleeccttss eevvoolluuttiioonnaarryy rreellaattiioonnsshhiippss  PPhhyyllooggeenneettiiccss ttrreeeess aarree tthhiinnggss wwhhiicchh rreefflleecctt tthhee eevvoolluuttiioonnaarryy rreellaattiioonnsshhiipp tthhrruu aa ppiiccttuurree//ggrraapphh  RRooootteedd ttrreeeess wwhheerree tthheerree iiss oonnllyy oonnee aanncceessttoorr  UUnn rrooootteedd ttrreeeess jjuusstt sshhoowwiinngg tthhee rreellaattiioonnsshhiipp  PPhhyyllooggeenneettiicc ttrreeee rreeccoonnssttrruuccttiioonn aallggoorriitthhmmss aarree aallssoo aann aarreeaa ooff rreesseeaarrcchh MM..AAllrrooyy MMaassccrreenngghhee 4444
  • 46. MMeeddiiccaall IImmpplliiccaattiioonnss  PPhhaarrmmaaccooggeennoommiiccss  NNoott aallll ddrruuggss wwoorrkk oonn aallll ppaattiieennttss,, ssoommee ggoooodd ddrruuggss ccaauussee ddeeaatthh iinn ssoommee ppaattiieennttss  SSoo bbyy ddooiinngg aa ggeennee aannaallyyssiiss bbeeffoorree tthhee ttrreeaattmmeenntt tthhee ooffffeennssiivvee ddrruuggss ccaann bbee aavvooiiddeedd  AAllssoo ddrruuggss wwhhiicchh ccaauussee ddeeaatthh ttoo mmoosstt ccaann bbee uusseedd oonn aa mmiinnoorriittyy ttoo wwhhoossee ggeenneess tthhaatt ddrruugg iiss wweellll ssuuiitteedd –– vvoolluunntteeeerrss wwaanntteedd!!  CCuussttoommiizzeedd ttrreeaattmmeenntt  GGeennee TThheerraappyy  RReeppllaaccee oorr ssuuppppllyy tthhee ddeeffeeccttiivvee oorr mmiissssiinngg ggeennee  IInnssuulliinn aanndd FFaaccttoorr VVIIIIII oorr HHaaeemmoopphhiilliiaa  BBiiooWWeeaappoonnss ((????)) MM..AAllrrooyy MMaassccrreenngghhee 4466
  • 47. DDiiaaggnnoossiiss ooff DDiisseeaassee  DDiiaaggnnoossiiss ooff ddiisseeaassee  IIddeennttiiffiiccaattiioonn ooff ggeenneess wwhhiicchh ccaauussee tthhee ddiisseeaassee wwiillll hheellpp ddeetteecctt ddiisseeaassee aatt eeaarrllyy ssttaaggee HHuunnttiinnggttoonn ddiisseeaassee --  SSyymmppttoommss –– uunnccoonnttrroollllaabbllee ddaannccee lliikkee mmoovveemmeennttss,, mmeennttaall ddiissttuurrbbaannccee,, ppeerrssoonnaalliittyy cchhaannggeess aanndd iinntteelllleeccttuuaall iimmppaaiirrmmeenntt  DDeeaatthh iinn 1100--1155 yyeeaarrss  TThhee ggeennee rreessppoonnssiibbllee ffoorr tthhee ddiisseeaassee hhaass bbeeeenn iiddeennttiiffiieedd  CCoonnttaaiinnss eexxcceessssiivveellyy rreeppeeaatteedd sseeccttiioonnss ooff CCAAGG  SSoo oonnccee aannaallyyzzeedd tthhee ccoouuppllee ccaann bbee ccoouunnsseelleedd MM..AAllrrooyy MMaassccrreenngghhee 4477
  • 48. DDrruugg DDeessiiggnn  CCaann ggoo uupp ttoo 1155yyrrss aanndd $$770000mmiilllliioonn  OOnnee ooff tthhee ggooaallss ooff bbiiooiinnffoorrmmaattiiccss iiss ttoo rreedduuccee tthhee ttiimmee aanndd ccoosstt iinnvvoollvveedd wwiitthh iitt..  TThhee pprroocceessss DDiissccoovveerryy  CCoommppuuttaattiioonnaall mmeetthhooddss ccaann iimmpprroovveess tthhiiss TTeessttiinngg MM..AAllrrooyy MMaassccrreenngghhee 4488
  • 49. DDiissccoovveerryy TTaarrggeett iiddeennttiiffiiccaattiioonn  IIddeennttiiffyyiinngg tthhee mmoolleeccuullee oonn wwhhiicchh tthhee ggeerrmmss rreelliieess ffoorr iittss ssuurrvviivvaall  TThheenn wwee ddeevveelloopp aannootthheerr mmoolleeccuullee ddrruugg wwhhiicchh wwiillll bbiinndd ttoo tthhee ttaarrggeett  SSoo tthhee ggeerrmm wwiillll nnoott bbee aabbllee ttoo iinntteerraacctt wwiitthh tthhee ttaarrggeett..  PPrrootteeiinnss aarree tthhee mmoosstt ccoommmmoonn ttaarrggeettss MM..AAllrrooyy MMaassccrreenngghhee 4499
  • 50. DDiissccoovveerryy……  FFoorr eexxaammppllee HHIIVV pprroodduucceess HHIIVV pprrootteeaassee wwhhiicchh iiss aa pprrootteeiinn aanndd wwhhiicchh iinn ttuurrnn eeaatt ootthheerr pprrootteeiinnss  TThhiiss HHIIVV pprrootteeaassee hhaass aann aaccttiivvee ssiittee wwhheerree iitt bbiinnddss ttoo ootthheerr mmoolleeccuulleess  SSoo HHIIVV ddrruugg wwiillll ggoo aanndd bbiinndd wwiitthh tthhaatt aaccttiivvee ssiittee EEaassiillyy ssaaiidd tthhaann ddoonnee!! MM..AAllrrooyy MMaassccrreenngghhee 5500
  • 51. DDiissccoovveerryy……  LLeeaadd ccoommppoouunnddss aarree tthhee mmoolleeccuulleess tthhaatt ggoo aanndd bbiinndd ttoo tthhee ttaarrggeett pprrootteeiinn’’ss aaccttiivvee ssiittee  TTrraaddiittiioonnaallllyy tthhiiss hhaass bbeeeenn aa ttrriiaall aanndd eerrrroorr mmeetthhoodd  NNooww tthhiiss iiss bbeeiinngg mmoovveedd iinnttoo tthhee rreeaallmm ooff ccoommppuutteerrss MM..AAllrrooyy MMaassccrreenngghhee 5511
  • 53. MM..AAllrrooyy MMaassccrreenngghhee 5533 PPEERRLL  PPeerrll iiss ccoommmmoonnllyy uusseedd ffoorr bbiiooiinnffoorrmmaattiiccss ccaallccuullaattiioonnss aass iittss aabbiilliittyy ttoo mmaanniippuullaattee cchhaarraacctteerr ssyymmbboollss  TThhee ddeeffaauulltt CCGGII llaanngguuaaggee  IItt ssttaarrtteedd oouutt aass aa ssccrriippttiinngg llaanngguuaaggee bbuutt hhaass bbeeccoommee aa ffuullllyy fflleeddggeedd llaanngguuaaggee  IITT hhaass eevveerryytthhiinngg nnooww,, eevveenn wweebb sseerrvviiccee ssuuppppoorrtt  hhttttpp::////bbiioo..ppeerrll..oorrgg
  • 54. TThhee ppllaaccee ooff XXMMLL && WWeebb SSeerrvviicceess  VVaarriioouuss mmaarrkkuupp llaanngguuaaggeess aarree bbeeiinngg ccrreeaatteedd –– GGeennee MMaarrkkuupp llaanngguuaaggee eettcc ttoo rreepprreesseenntt sseeqquueennccee//ggeennee ddaattaa  WWeebb SSeerrvviicceess –– pprrooggrraamm ttoo pprrooggrraamm iinntteerraaccttiioonn,, mmaakkiinngg tthhee wweebb aapppplliiccaattiioonn cceennttrriicc aass ooppppoosseedd ttoo hhuummaann cceennttrriicc  SSoo tthhiiss hhaass ttoo ppllaattffoorrmm llaanngguuaaggee iinnddeeppeennddeenntt  PPrroottooccoollss lliikkee SSOOAAPP hheellpp iinn tthhiiss rreeggaarrdd  IInn bbiiooiinnffoorrmmaattiiccss vvaarriioouuss ddaattaabbaasseess aarree bbeeiinngg uusseedd,, ddiiffffeerreenntt ppllaattffoorrmmss,, llaanngguuaaggeess eettcc  SSoo wweebb sseerrvviicceess hheellppss aacchhiieevvee ppllaattffoorrmm iinnddeeppeennddeennccee aanndd pprrooggrraamm iinntteerraaccttiioonn  SSiinnccee sseeqquueennccee ddaattaa bbaasseess aarree iinn vvaarriioouuss ffoorrmmaattss,, ppllaattffoorrmmss SSOOAAPP aallssoo hheellppss iinn tthhiiss rreeggaarrddss MM..AAllrrooyy MMaassccrreenngghhee 5544
  • 55. TThhee ppllaaccee ooff GGRRIIDD  GGRRIIDD -- nneeww kkiidd oonn tthhee bblloocckk  UUssiinngg mmaannyy ccoommppuutteerrss ttoo ffuullffiillll aa ssiinnggllee ccoommppuuttaattiioonnaall ttaasskkss  BBiiooiinnffoorrmmaattiiccss iiss tthhee iiddeeaall ppllaattffoorrmm aass iitt hhaass ttoo ddeeaall wwiitthh aa llaarrggee aammoouunntt ooff ddaattaa iinn aalliiggnnmmeenntt aanndd sseeaarrcchheess  EE--sscciieennccee iinniittiiaattiivvee iinn tthhee UUKK  OORRAACCLLEE 1100gg –– tthhee wwoorrllddss ffiirrsstt GGRRIIDD ddaattaabbaassee MM..AAllrrooyy MMaassccrreenngghhee 5555
  • 56. DDaattaa bbaasseess aanndd MMiinniinngg  LLoott ooff tthhee sseeqquueennccee ddaattaabbaasseess aarree aavvaaiillaabbllee ppuubblliiccllyy  AAss tthheerree iiss aa DDBB iinnvvoollvveedd vvaarriioouuss ddaattaa mmiinniinngg tteecchhnniiqquueess aarree uusseedd ttoo ppuullll tthhee ddaattaa oouutt  AAss tthheerree iiss aa lloott ooff lliitteerraattuurree –– aarrttiicclleess eettcc –– oonn tthhiiss aarreeaa aa ddaattaa mmiinniinngg oonn tthhee lliitteerraattuurree –– nnoott oonn tthhee sseeqquueennccee ddaattaa hhaass aallssoo bbeeccoommee aa PPhhDD ttooppiicc ffoorr mmaannyy MM..AAllrrooyy MMaassccrreenngghhee 5566
  • 57. EEuurrooppeeaann MMoolleeccuullaarr BBiioollooggyy NNeettwwoorrkk ((EEMMBBnneett))  AA cceennttrraall ssyysstteemm ffoorr sshhaarriinngg,, ttrraaiinniinngg aanndd cceennttrraalliizziinngg uupp ttoo ddaattee bbiioo iinnffoo  SSoommee ooff tthhee EEMMBBnneett ssiitteess aarree::  SSQQEENNEETT  hhttttpp::////wwwwww..sseeqqnneett..ddll..aacc..uukk MM..AAllrrooyy MMaassccrreenngghhee 5577  UUCCLL  hhttttpp::////wwwwww..bbiioocchheemm..uuccll..aacc..uukk//bbssmm//ddbbbbrroowwsseerr// EEBBII –– EEuurrooppeeaann BBiiooiinnffoorrmmaattiiccss IInnssttiittuuttee  wwwwww..eebbii..aacc..uukk
  • 58. RReeffeerreenncceess  DDaann EE.. KKrraannee aanndd MMiicchhaaeell LL.. RRaayymmeerr  BBaassiicc CCoonncceeppttss ooff BBiiooiinnffoorrmmaattiiccss  AArrtthhuurr MM LLeesskk  IInnttrroo ttoo BBiiooiinnffoorrmmaattiiccss  TT..KK.. AAttttwwoooodd && DD.. J.. PPaarrrryy--SSmmiitthh  IInnttrroo ttoo BBiiooiinnffoorrmmaattiiccss  TThhee ggeenneettiicc RReevvoolluuttiioonn  DDrr PPaattrriicckk DDiixxoonn  PPrrooff DDaavviidd GGiillbbeerrtt’’ss SSiittee hhttttpp::////wwwwww..bbrrcc..ddccss..ggllaa..aacc..uukk//~~ddrrgg// MM..AAllrrooyy MMaassccrreenngghhee 5588
  • 59. TThhaannkk YYoouu!! MM..AAllrrooyy MMaassccrreenngghhee 5599