SlideShare uma empresa Scribd logo
1 de 63
Baixar para ler offline
バイオインフォマティクス
     大学共同利用機関法人
   情報・システム研究機構 (ROIS)
 ライフサイエンス統合データベースセンター
         (DBCLS)
        坊農 秀雅
                   © 2012 DBCLS Licensed under CC 表示 2.1 日本
本講義の内容
    • 「道具」と「部品」を扱うための知識
    1.バイオインフォマティクスとは
    2.基本的なコンピュータリテラシー
    • それらの道具を用いて「生物情報」を 実際
    の研究に役立てていくアプローチ
    3.文献情報検索
    4.塩基配列データベースとゲノムブラウザー
    5.遺伝子発現情報データベース

2                 © 2012 DBCLS Licensed under CC 表示 2.1 日本
1. バイオインフォマティクスとは
    • 生命現象を「情報」の立場で解明していこうと
    する研究
    • バイオテクノロジーと生命の情報処理を意味す
    るインフォマティクスを連携させた技術
    • コンピュータを実験デバイスとして使って、生
    物学的に有意な結論を引き出そうとする学問
    –坊農秀雅「バイオインフォマティクス入門」
     羊土社 2002
3                  © 2012 DBCLS Licensed under CC 表示 2.1 日本
バイオインフォマティクスの歴史
    • ツール
     ‒配列解析:ドットマトリックス       
      (ハープロット)→ 動的計画法
      •RNA二次構造予測
     ‒配列類似(相同)性検索
      •FASTA, BLAST, BLAT etc.

    • データベース(DB)
     ‒最初のDB: タンパク質 (アミノ酸)配列
     ‒塩基配列DB:1980年代初頭
4                                © 2012 DBCLS Licensed under CC 表示 2.1 日本
日米での標準的なバイオインフォ
      マティクスのテキスト




5           © 2012 DBCLS Licensed under CC 表示 2.1 日本
バイオインフォマティクスの範疇
          イメージ解析

         遺伝子発現解析


         アミノ酸配列解析
          塩基配列解析

         パスウェイ解析

         シミュレーション

       さらに、臨床データ解析も
6              © 2012 DBCLS Licensed under CC 表示 2.1 日本
(かつての)バイオインフォマ
     ティクス研究者の職種別分類
    • アルゴリズム屋                                   数学的
     –方法を考える人                                   抽象的


     –「NP完全」がキーワード
    • 実装屋
     –プログラムやツールを書く人
                                                生物的

     Biologistの範疇
    • 解析屋
     –プログラムを使って実際に生データを相手に手を
                                                具体的




      動かす人
7                    © 2012 DBCLS Licensed under CC 表示 2.1 日本
2. 基本的なコンピュータリテラシー
    • インターネット検索
    –Google検索(ググる)

    • ライフサイエンス分野に特化した検索
    –データベースを探す
     • integbioデータベースカタログ

    –データベースを検索する
     • 生命科学データベース横断検索
    –使い方を動画で知る
9                       © 2012 DBCLS Licensed under CC 表示 2.1 日本
http://integbio.jp/dbcatalog/




10               © 2012 DBCLS Licensed under CC 表示 2.1 日本
http://integbio.jp/dbcatalog/




11               © 2012 DBCLS Licensed under CC 表示 2.1 日本
高血圧




12   © 2012 DBCLS Licensed under CC 表示 2.1 日本
13   © 2012 DBCLS Licensed under CC 表示 2.1 日本
14   © 2012 DBCLS Licensed under CC 表示 2.1 日本
15   © 2012 DBCLS Licensed under CC 表示 2.1 日本
ライフサイエンスデータの
統合DBとは? ロジスティクス(流通業)

•NBDC/DBCLS/DDBJ を中心に
  日本中のさまざまな大学・研究機関が協力
• 安心してすぐに利用できるデータを提供
 ‒ 「ぐるなび」、「食べログ」、「クックパッド」

• 公共DBとして外に出す際にデータを綺麗に
 ‒「分別回収→リサイクル」



                 © 2012 DBCLS Licensed under CC 表示 2.1 日本
統合TV (togoTV)
 •動画によるDBやツールのチュートリアル
     ‒ 各DBやツール名、     で検索
 •統合データベース講演会AJACSの動画も
 •YouTubeからも
 •Videocastでも
 •約650のコンテンツ
     (アップデート含む)
17                  © 2012 DBCLS Licensed under CC 表示 2.1 日本
統合TV(togoTV)




18      © 2012 DBCLS Licensed under CC 表示 2.1 日本
医学研究で多用するウェブツール
     3.文献情報検索
     –PubMed とそれを利用した各サービス
     –日本語文献検索(ライフサイエンス新着論文レビュー他)
     4.塩基配列データベースとゲノムブラウザー
     –RefSeq
     –SRA
     –UCSC Genome Browser
     5.遺伝子発現解析
     –NCBI GEO(Gene Expression Omnibus)とGEO目次
     –BioGPS
     –RefEx
20                          © 2012 DBCLS Licensed under CC 表示 2.1 日本
3. 文献情報検索
     • 英文: PubMed
      –inMeXes: 逐次PubMed/MEDLINE表現検索
      –Allie: 略語検索

     • 日本語: cinii
      –ライフサイエンス新着論文レビュー
      –ライフサイエンス領域融合レビュー
      –蛋白質核酸酵素 全文検索

21                        © 2012 DBCLS Licensed under CC 表示 2.1 日本
PubMed
     • http://pubmed.gov/
     • 米国立医学図書館(NLM: National Library of
      Medicine)が編纂する医学文献DB
      –件数: (20121223 16:00現在)



      –NLMの下部組織NCBI(National Center for
       Biotechnology Information)のEntrezから検索可能
              「PubMedで論文を検索する」
              http://togotv.dbcls.jp/20120830.html
22                                © 2012 DBCLS Licensed under CC 表示 2.1 日本
PubMed 検索例: ‘cancer’




23                © 2012 DBCLS Licensed under CC 表示 2.1 日本
inMeXes
     • http://docman.dbcls.jp/im/
     • ライフサイエンス統合DBセンター(DBCLS)
     が提供する逐次PubMed/MEDLINE表現検索




           「inMeXesを使い倒す」
           http://togotv.dbcls.jp/20091216.html
24                             © 2012 DBCLS Licensed under CC 表示 2.1 日本
25   © 2012 DBCLS Licensed under CC 表示 2.1 日本
Life
     Science
     Dictionary
     のサイトにリンク




26                © 2012 DBCLS Licensed under CC 表示 2.1 日本
Allie
     • http://allie.dbcls.jp/
     • Allie(アリー)は生命科学分野において利用され
     ている略語とその展開形を検索するサービス




          「Allieを使って略語の正式名称を検索する2010」
          http://togotv.dbcls.jp/20100831.html
27                         © 2012 DBCLS Licensed under CC 表示 2.1 日本
Allie検索例: ‘SPF’




28             © 2012 DBCLS Licensed under CC 表示 2.1 日本
CiNii
     • http://ci.nii.ac.jp/
     • 国立情報学研究所(NII: National Institute of
      Informatics) が提供する日本語文献検索シス
      テム。「さいにー」と発音




             作成中…‘CiNii’で以下のフォームから検索
             http://togotv-curated.dbcls.jp/
29                           © 2012 DBCLS Licensed under CC 表示 2.1 日本
cinii 検索例: 「がん 低酸素」




30               © 2012 DBCLS Licensed under CC 表示 2.1 日本
ライフサイエンス新着論文レビュー
            http://first.lifesciencedb.jp/
     Nature, Science, Cell などのトップジャーナル
     に掲載された日本人を著者とする生命科学分野
     の論文について論文の著者自身の執筆による専
     門分野の異なる生命科学研究者にむけた日本語
     によるレビューを、自由に閲覧・利用できるよ
     うウェブ上にていち早く無料で公開するサイト
            「ライフサイエンス新着論文レビュー
            FirstAuthor's を使い倒す」
            http://togotv.dbcls.jp/20110301.html
                                 © 2012 DBCLS Licensed under CC 表示 2.1 日本
31
クリエイティブ・
                 コモンズ 表示 2.1
32   © 2012 DBCLS Licensed under CC 表示 2.1 日本
ライフサイエンス領域融合レビュー
        http://leading.lifesciencedb.jp/

     生命科学において注目される分野・学問
     領域における最新の研究成果について、
     第一線の研究者の執筆による日本語の レ
     ビューを、だれでも自由に閲覧・利用で
     きるよう、無料で公開します。
        「ライフサイエンス領域融合レビュー
        LeadingAuthor'sを使い倒す」
        http://togotv.dbcls.jp/20121113.html
33                           © 2012 DBCLS Licensed under CC 表示 2.1 日本
34   © 2012 DBCLS Licensed under CC 表示 2.1 日本
蛋白質核酸酵素 全文検索
 • http://lifesciencedb.jp/pne/
 • 生化学・分子生物学の日本語総説誌
     –Since 1953, しかし2010年1月休刊

 • 1985年∼2008年の通常号の総説、計2,216論文
     が対象
     –2009,2010年分の全文検索結果については共立出版
     のサイトに掲載されている抄録へのリンクのみ
            「蛋白質核酸酵素全文検索を使い倒す」
            http://togotv.dbcls.jp/20080911.html
35                             © 2012 DBCLS Licensed under CC 表示 2.1 日本
36   © 2012 DBCLS Licensed under CC 表示 2.1 日本
4. 塩基配列データベースと
                ゲノムブラウザー
     • RefSeq
      –GGRNA
     • Sequence Read Archive(SRA)
     • UCSC Genome Browser
      –遺伝子名から検索
      –ゲノムアノテーションをカスタマイズする
        • 例: 転写因子結合サイト


38                           © 2012 DBCLS Licensed under CC 表示 2.1 日本
RefSeqとは
     • Reference Sequenceの略
     • NCBIが提供する配列解析に使うための文字通り
      "reference"(リファレンス)となるべき配列データベース
      のこと
     • その配列の多くは核酸配列データベースのDDBJや
      EMBL、GenBank由来であり、それらの中からもっと
      も代表としてふさわしい(参照の基準となる)ものが、
      目で見て選ばれている
              「遺伝子のRefSeq IDを調べる 2011」
              http://togotv.dbcls.jp/20110218.html
39                                © 2012 DBCLS Licensed under CC 表示 2.1 日本
GGRNA
     • http://ggrna.dbcls.jp/
     • ライフサイエンス統合DBセンター(DBCLS)
     が提供する遺伝子(RefSeq)をGoogleのよう
     に検索できるサイト




          「GGRNAで遺伝子をGoogleのよう
          に検索する」
          http://togotv.dbcls.jp/20120124.html
                                © 2012 DBCLS Licensed under CC 表示 2.1 日本
40
GGRNA検索例




41        © 2012 DBCLS Licensed under CC 表示 2.1 日本
核酸配列DB

           INSDC        NCBI
     DDBJ/EMBL/GenBank RefSeq
     nr/nt Title:Nucleotide collection (nt)
     Description:The nucleotide collection consists of
     GenBank+EMBL+DDBJ+PDB+RefSeq sequences,
     but excludes EST, STS, GSS, WGS, TSA, patent
                                                                Sequence
     sequences as well as phase 0, 1, and 2 HTGS
     sequences. The database is partially non-redundant.          Read
                                                                 Archive
     TraceArchive                                                 (SRA)
42                                                    © 2012 DBCLS Licensed under CC 表示 2.1 日本
SRA(Sequence Read Archive)
     • いわゆる次世代シーケンサー(NGS)から得ら
      れる塩基配列のアーカイブ




     データ取得元: DBCLS SRA http://sra.dbcls.jp/
43                          © 2012 DBCLS Licensed under CC 表示 2.1 日本
文献情報からNGSデータを検索




        DBCLS SRA http://sra.dbcls.jp/
44                    © 2012 DBCLS Licensed under CC 表示 2.1 日本
疾患別NGSデータ登録数
         2012/12/25現在。
         データ取得元:DBCLS SRA
         http://sra.dbcls.jp/cgi-bin/diseasetree.cgi




45                    © 2012 DBCLS Licensed under CC 表示 2.1 日本
Genome Browserとは?
     • アノテーションが付加された遺伝子のゲノム
     上の位置やその周辺を表示できるツール
     –UCSC Genome Browser http://genome.ucsc.edu/
     –Ensembl Genome Browser http://ensembl.org/




46                             © 2012 DBCLS Licensed under CC 表示 2.1 日本
遺伝子名から検索




47        © 2012 DBCLS Licensed under CC 表示 2.1 日本
48   © 2012 DBCLS Licensed under CC 表示 2.1 日本
49   © 2012 DBCLS Licensed under CC 表示 2.1 日本
50   © 2012 DBCLS Licensed under CC 表示 2.1 日本
使い方いろいろ。
          詳しくは統合TVで
     • ゲノムアノテーションをカスタマイズする
          「UCSC Genome Browserの使い方∼
          表示+ENCODE編∼ 2012」
          http://togotv.dbcls.jp/20120528.html


     • BLATを使って塩基・アミノ酸配列断片から
     検索   「ウイルスの持ち出した宿主の遺伝子配列が
          コードされている領域をアミノ酸配列レベル
          でゲノム中から探し当てる 2012」
          http://togotv.dbcls.jp/20121030.html
51                           © 2012 DBCLS Licensed under CC 表示 2.1 日本
5. 遺伝子発現解析
     • NCBI GEO(Gene Expression Omnibus)
       –GEO目次
     • BioGPS
     • RefEx
     • Human Protein Atlas




53                           © 2012 DBCLS Licensed under CC 表示 2.1 日本
NCBI GEO
     • Gene Expression Omnibus(GEO)
     • NCBIによる遺伝子発現情報のアーカイブ
      –現状、主にマイクロアレイ実験による発現データ
      –今後、RNA-seqなど次世代シーケンサーによる
       データが増えてくると見込まれる

            「NCBI GEOの使い方1∼マイクロアレイデー
            タの検索・取得∼ 2011」
            http://togotv.dbcls.jp/20110711.html
            「NCBI GEOの使い方2∼遺伝子プロファイル
            の検索・処理済みデータの取得∼」
            http://togotv.dbcls.jp/20111020.html
54                         © 2012 DBCLS Licensed under CC 表示 2.1 日本
GEO目次
     • http://lifesciencedb.jp/geo/
     • NCBI GEO を快適に使い、データの全容を
     俯瞰するための仕組み
     • ライフサイエンス統合DBセンター(DBCLS)
     が提供。週一回更新。


            「遺伝子発現バンク(GEO)目次を使い倒す
            2010」
            http://togotv.dbcls.jp/20100326.html
55                           © 2012 DBCLS Licensed under CC 表示 2.1 日本
GEO 目次




56       © 2012 DBCLS Licensed under CC 表示 2.1 日本
BioGPS
     • http://biogps.org/
     • GeneChipを用いたヒト、マウス、ラットの
     さまざまな組織や細胞(株)における遺伝子発
     現プロファイルのデータベース
     • 英語版Wikipedia(Gene Wiki)等、様々な外部
     データベースへのリンクが充実

            「遺伝子発現プロファイルデータベース
            BioGPSを使い倒す 2012」
            http://togotv.dbcls.jp/20120911.html
57                            © 2012 DBCLS Licensed under CC 表示 2.1 日本
BioGPS検索例: ‘pparg’




58              © 2012 DBCLS Licensed under CC 表示 2.1 日本
59   © 2012 DBCLS Licensed under CC 表示 2.1 日本
RefEx
      (Reference Expression dataset)
     •http://refex.dbcls.jp/
     4つの異なる実験手法(EST、GeneChip、
     CAGE、RNA-seq)によって得られた40種類
     の正常組織における遺伝子発現データを統合
     し並列に表現することで、手法間の比較とと
     もに各遺伝子の発現量を直感的に比較するこ
     とが可能なリファレンス(参照)データセット
                 作成中…‘RefEx’で以下のフォームから検索
                 http://togotv-curated.dbcls.jp/
60                             © 2012 DBCLS Licensed under CC 表示 2.1 日本
RefEx




61       © 2012 DBCLS Licensed under CC 表示 2.1 日本
RefEx
     liver specific genes




62               © 2012 DBCLS Licensed under CC 表示 2.1 日本
RefEx:
     Specific gene




63            © 2012 DBCLS Licensed under CC 表示 2.1 日本
Human Protein Atlas
     • http://www.proteinatlas.org/
     • 14,079 genes with protein expression
       profiles based on 17,298 antibodies.



           ESR1




                  「Human Protein Atlasでタンパク質の発現状
                  況を調べる2011」
                  http://togotv.dbcls.jp/20110113.html
64                                © 2012 DBCLS Licensed under CC 表示 2.1 日本
Human Protein Atlas 検索例:
              ‘ESR1’




65                 © 2012 DBCLS Licensed under CC 表示 2.1 日本
66   © 2012 DBCLS Licensed under CC 表示 2.1 日本
まとめ
     • バイオインフォマティクスは
     –「道具」として21世紀の医学生物学に必須
     –「道具」「部品」ともに勃興が著しい

     • 最新の「部品」情報をインターネット検索
     を駆使して把握し、「道具」の原理をある程
     度理解して、使い倒しましょう!
     • 復習はこのアイコンを目印に!
         統合TVによる統合TV(統合TV Curated)の使い方
         http://togotv.dbcls.jp/20110406.html
67                       © 2012 DBCLS Licensed under CC 表示 2.1 日本

Mais conteúdo relacionado

Semelhante a バイオインフォマティクス(2013年度以降用改訂版)

20140612 ddbjing_minowa_NBDChumanDB&JGA
20140612 ddbjing_minowa_NBDChumanDB&JGA20140612 ddbjing_minowa_NBDChumanDB&JGA
20140612 ddbjing_minowa_NBDChumanDB&JGAMTMinowa
 
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~Hidemasa Bono
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状Takeru Nakazato
 
NBDCヒトデータベースのルールと仕組み
NBDCヒトデータベースのルールと仕組みNBDCヒトデータベースのルールと仕組み
NBDCヒトデータベースのルールと仕組みMTMinowa
 
DroidKaigi アプリの内部を見る
DroidKaigi アプリの内部を見るDroidKaigi アプリの内部を見る
DroidKaigi アプリの内部を見る健一 辰濱
 
【より深く知ろう】活用最先端!データベースとアプリケーション開発をシンプルに、高速化するテクニック
【より深く知ろう】活用最先端!データベースとアプリケーション開発をシンプルに、高速化するテクニック【より深く知ろう】活用最先端!データベースとアプリケーション開発をシンプルに、高速化するテクニック
【より深く知ろう】活用最先端!データベースとアプリケーション開発をシンプルに、高速化するテクニックオラクルエンジニア通信
 
福井イベント
福井イベント福井イベント
福井イベントYoshio Terada
 
オラクルの運用管理ソリューションご紹介(2021/02 版)
オラクルの運用管理ソリューションご紹介(2021/02 版)オラクルの運用管理ソリューションご紹介(2021/02 版)
オラクルの運用管理ソリューションご紹介(2021/02 版)オラクルエンジニア通信
 
生物学論文マイニング
生物学論文マイニング生物学論文マイニング
生物学論文マイニングtabris2012
 
Jenkins user conference 東京
Jenkins user conference 東京Jenkins user conference 東京
Jenkins user conference 東京Kohsuke Kawaguchi
 
実はとても面白い...Documentation library
実はとても面白い...Documentation library実はとても面白い...Documentation library
実はとても面白い...Documentation libraryKouta Shiobara
 
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DNA Data Bank of Japan center
 
海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)
海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)
海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)Yoshida-South Library, Kyoto University
 

Semelhante a バイオインフォマティクス(2013年度以降用改訂版) (15)

20140612 ddbjing_minowa_NBDChumanDB&JGA
20140612 ddbjing_minowa_NBDChumanDB&JGA20140612 ddbjing_minowa_NBDChumanDB&JGA
20140612 ddbjing_minowa_NBDChumanDB&JGA
 
[All-in-one2015] DDBJ へのデータ登録
[All-in-one2015] DDBJ へのデータ登録[All-in-one2015] DDBJ へのデータ登録
[All-in-one2015] DDBJ へのデータ登録
 
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
 
Swc2013 yamamoto
Swc2013 yamamotoSwc2013 yamamoto
Swc2013 yamamoto
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状
 
NBDCヒトデータベースのルールと仕組み
NBDCヒトデータベースのルールと仕組みNBDCヒトデータベースのルールと仕組み
NBDCヒトデータベースのルールと仕組み
 
DroidKaigi アプリの内部を見る
DroidKaigi アプリの内部を見るDroidKaigi アプリの内部を見る
DroidKaigi アプリの内部を見る
 
【より深く知ろう】活用最先端!データベースとアプリケーション開発をシンプルに、高速化するテクニック
【より深く知ろう】活用最先端!データベースとアプリケーション開発をシンプルに、高速化するテクニック【より深く知ろう】活用最先端!データベースとアプリケーション開発をシンプルに、高速化するテクニック
【より深く知ろう】活用最先端!データベースとアプリケーション開発をシンプルに、高速化するテクニック
 
福井イベント
福井イベント福井イベント
福井イベント
 
オラクルの運用管理ソリューションご紹介(2021/02 版)
オラクルの運用管理ソリューションご紹介(2021/02 版)オラクルの運用管理ソリューションご紹介(2021/02 版)
オラクルの運用管理ソリューションご紹介(2021/02 版)
 
生物学論文マイニング
生物学論文マイニング生物学論文マイニング
生物学論文マイニング
 
Jenkins user conference 東京
Jenkins user conference 東京Jenkins user conference 東京
Jenkins user conference 東京
 
実はとても面白い...Documentation library
実はとても面白い...Documentation library実はとても面白い...Documentation library
実はとても面白い...Documentation library
 
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開
 
海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)
海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)
海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)
 

Mais de Hidemasa Bono

新規医療開発に関わる統計学 (バイオインフォマティクス)
新規医療開発に関わる統計学 (バイオインフォマティクス)新規医療開発に関わる統計学 (バイオインフォマティクス)
新規医療開発に関わる統計学 (バイオインフォマティクス)Hidemasa Bono
 
What was togofarm on earth?
What was togofarm on earth?What was togofarm on earth?
What was togofarm on earth?Hidemasa Bono
 
データベース活用による 知のめぐりのよい細胞生物学
データベース活用による 知のめぐりのよい細胞生物学データベース活用による 知のめぐりのよい細胞生物学
データベース活用による 知のめぐりのよい細胞生物学Hidemasa Bono
 
Integrated database biology with well-curated and circulated knowledge
Integrated database biology with well-curated and circulated knowledgeIntegrated database biology with well-curated and circulated knowledge
Integrated database biology with well-curated and circulated knowledgeHidemasa Bono
 
bonohu's presentation in Osaka.R#6
bonohu's presentation in Osaka.R#6bonohu's presentation in Osaka.R#6
bonohu's presentation in Osaka.R#6Hidemasa Bono
 

Mais de Hidemasa Bono (6)

新規医療開発に関わる統計学 (バイオインフォマティクス)
新規医療開発に関わる統計学 (バイオインフォマティクス)新規医療開発に関わる統計学 (バイオインフォマティクス)
新規医療開発に関わる統計学 (バイオインフォマティクス)
 
What was togofarm on earth?
What was togofarm on earth?What was togofarm on earth?
What was togofarm on earth?
 
データベース活用による 知のめぐりのよい細胞生物学
データベース活用による 知のめぐりのよい細胞生物学データベース活用による 知のめぐりのよい細胞生物学
データベース活用による 知のめぐりのよい細胞生物学
 
TogoRecipes 120907
TogoRecipes 120907TogoRecipes 120907
TogoRecipes 120907
 
Integrated database biology with well-curated and circulated knowledge
Integrated database biology with well-curated and circulated knowledgeIntegrated database biology with well-curated and circulated knowledge
Integrated database biology with well-curated and circulated knowledge
 
bonohu's presentation in Osaka.R#6
bonohu's presentation in Osaka.R#6bonohu's presentation in Osaka.R#6
bonohu's presentation in Osaka.R#6
 

バイオインフォマティクス(2013年度以降用改訂版)

  • 1. バイオインフォマティクス 大学共同利用機関法人 情報・システム研究機構 (ROIS) ライフサイエンス統合データベースセンター (DBCLS) 坊農 秀雅 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 2. 本講義の内容 • 「道具」と「部品」を扱うための知識 1.バイオインフォマティクスとは 2.基本的なコンピュータリテラシー • それらの道具を用いて「生物情報」を 実際 の研究に役立てていくアプローチ 3.文献情報検索 4.塩基配列データベースとゲノムブラウザー 5.遺伝子発現情報データベース 2 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 3. 1. バイオインフォマティクスとは • 生命現象を「情報」の立場で解明していこうと する研究 • バイオテクノロジーと生命の情報処理を意味す るインフォマティクスを連携させた技術 • コンピュータを実験デバイスとして使って、生 物学的に有意な結論を引き出そうとする学問 –坊農秀雅「バイオインフォマティクス入門」 羊土社 2002 3 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 4. バイオインフォマティクスの歴史 • ツール ‒配列解析:ドットマトリックス        (ハープロット)→ 動的計画法 •RNA二次構造予測 ‒配列類似(相同)性検索 •FASTA, BLAST, BLAT etc. • データベース(DB) ‒最初のDB: タンパク質 (アミノ酸)配列 ‒塩基配列DB:1980年代初頭 4 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 5. 日米での標準的なバイオインフォ マティクスのテキスト 5 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 6. バイオインフォマティクスの範疇 イメージ解析 遺伝子発現解析 アミノ酸配列解析 塩基配列解析 パスウェイ解析 シミュレーション さらに、臨床データ解析も 6 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 7. (かつての)バイオインフォマ ティクス研究者の職種別分類 • アルゴリズム屋 数学的 –方法を考える人 抽象的 –「NP完全」がキーワード • 実装屋 –プログラムやツールを書く人 生物的 Biologistの範疇 • 解析屋 –プログラムを使って実際に生データを相手に手を 具体的 動かす人 7 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 8. 2. 基本的なコンピュータリテラシー • インターネット検索 –Google検索(ググる) • ライフサイエンス分野に特化した検索 –データベースを探す • integbioデータベースカタログ –データベースを検索する • 生命科学データベース横断検索 –使い方を動画で知る 9 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 9. http://integbio.jp/dbcatalog/ 10 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 10. http://integbio.jp/dbcatalog/ 11 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 11. 高血圧 12 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 12. 13 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 13. 14 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 14. 15 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 15. ライフサイエンスデータの 統合DBとは? ロジスティクス(流通業) •NBDC/DBCLS/DDBJ を中心に 日本中のさまざまな大学・研究機関が協力 • 安心してすぐに利用できるデータを提供 ‒ 「ぐるなび」、「食べログ」、「クックパッド」 • 公共DBとして外に出す際にデータを綺麗に ‒「分別回収→リサイクル」 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 16. 統合TV (togoTV) •動画によるDBやツールのチュートリアル ‒ 各DBやツール名、 で検索 •統合データベース講演会AJACSの動画も •YouTubeからも •Videocastでも •約650のコンテンツ (アップデート含む) 17 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 17. 統合TV(togoTV) 18 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 18. 医学研究で多用するウェブツール 3.文献情報検索 –PubMed とそれを利用した各サービス –日本語文献検索(ライフサイエンス新着論文レビュー他) 4.塩基配列データベースとゲノムブラウザー –RefSeq –SRA –UCSC Genome Browser 5.遺伝子発現解析 –NCBI GEO(Gene Expression Omnibus)とGEO目次 –BioGPS –RefEx 20 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 19. 3. 文献情報検索 • 英文: PubMed –inMeXes: 逐次PubMed/MEDLINE表現検索 –Allie: 略語検索 • 日本語: cinii –ライフサイエンス新着論文レビュー –ライフサイエンス領域融合レビュー –蛋白質核酸酵素 全文検索 21 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 20. PubMed • http://pubmed.gov/ • 米国立医学図書館(NLM: National Library of Medicine)が編纂する医学文献DB –件数: (20121223 16:00現在) –NLMの下部組織NCBI(National Center for Biotechnology Information)のEntrezから検索可能 「PubMedで論文を検索する」 http://togotv.dbcls.jp/20120830.html 22 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 21. PubMed 検索例: ‘cancer’ 23 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 22. inMeXes • http://docman.dbcls.jp/im/ • ライフサイエンス統合DBセンター(DBCLS) が提供する逐次PubMed/MEDLINE表現検索 「inMeXesを使い倒す」 http://togotv.dbcls.jp/20091216.html 24 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 23. 25 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 24. Life Science Dictionary のサイトにリンク 26 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 25. Allie • http://allie.dbcls.jp/ • Allie(アリー)は生命科学分野において利用され ている略語とその展開形を検索するサービス 「Allieを使って略語の正式名称を検索する2010」 http://togotv.dbcls.jp/20100831.html 27 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 26. Allie検索例: ‘SPF’ 28 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 27. CiNii • http://ci.nii.ac.jp/ • 国立情報学研究所(NII: National Institute of Informatics) が提供する日本語文献検索シス テム。「さいにー」と発音 作成中…‘CiNii’で以下のフォームから検索 http://togotv-curated.dbcls.jp/ 29 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 28. cinii 検索例: 「がん 低酸素」 30 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 29. ライフサイエンス新着論文レビュー http://first.lifesciencedb.jp/ Nature, Science, Cell などのトップジャーナル に掲載された日本人を著者とする生命科学分野 の論文について論文の著者自身の執筆による専 門分野の異なる生命科学研究者にむけた日本語 によるレビューを、自由に閲覧・利用できるよ うウェブ上にていち早く無料で公開するサイト 「ライフサイエンス新着論文レビュー FirstAuthor's を使い倒す」 http://togotv.dbcls.jp/20110301.html © 2012 DBCLS Licensed under CC 表示 2.1 日本 31
  • 30. クリエイティブ・ コモンズ 表示 2.1 32 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 31. ライフサイエンス領域融合レビュー http://leading.lifesciencedb.jp/ 生命科学において注目される分野・学問 領域における最新の研究成果について、 第一線の研究者の執筆による日本語の レ ビューを、だれでも自由に閲覧・利用で きるよう、無料で公開します。 「ライフサイエンス領域融合レビュー LeadingAuthor'sを使い倒す」 http://togotv.dbcls.jp/20121113.html 33 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 32. 34 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 33. 蛋白質核酸酵素 全文検索 • http://lifesciencedb.jp/pne/ • 生化学・分子生物学の日本語総説誌 –Since 1953, しかし2010年1月休刊 • 1985年∼2008年の通常号の総説、計2,216論文 が対象 –2009,2010年分の全文検索結果については共立出版 のサイトに掲載されている抄録へのリンクのみ 「蛋白質核酸酵素全文検索を使い倒す」 http://togotv.dbcls.jp/20080911.html 35 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 34. 36 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 35. 4. 塩基配列データベースと ゲノムブラウザー • RefSeq –GGRNA • Sequence Read Archive(SRA) • UCSC Genome Browser –遺伝子名から検索 –ゲノムアノテーションをカスタマイズする • 例: 転写因子結合サイト 38 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 36. RefSeqとは • Reference Sequenceの略 • NCBIが提供する配列解析に使うための文字通り "reference"(リファレンス)となるべき配列データベース のこと • その配列の多くは核酸配列データベースのDDBJや EMBL、GenBank由来であり、それらの中からもっと も代表としてふさわしい(参照の基準となる)ものが、 目で見て選ばれている 「遺伝子のRefSeq IDを調べる 2011」 http://togotv.dbcls.jp/20110218.html 39 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 37. GGRNA • http://ggrna.dbcls.jp/ • ライフサイエンス統合DBセンター(DBCLS) が提供する遺伝子(RefSeq)をGoogleのよう に検索できるサイト 「GGRNAで遺伝子をGoogleのよう に検索する」 http://togotv.dbcls.jp/20120124.html © 2012 DBCLS Licensed under CC 表示 2.1 日本 40
  • 38. GGRNA検索例 41 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 39. 核酸配列DB INSDC NCBI DDBJ/EMBL/GenBank RefSeq nr/nt Title:Nucleotide collection (nt) Description:The nucleotide collection consists of GenBank+EMBL+DDBJ+PDB+RefSeq sequences, but excludes EST, STS, GSS, WGS, TSA, patent Sequence sequences as well as phase 0, 1, and 2 HTGS sequences. The database is partially non-redundant. Read Archive TraceArchive (SRA) 42 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 40. SRA(Sequence Read Archive) • いわゆる次世代シーケンサー(NGS)から得ら れる塩基配列のアーカイブ データ取得元: DBCLS SRA http://sra.dbcls.jp/ 43 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 41. 文献情報からNGSデータを検索 DBCLS SRA http://sra.dbcls.jp/ 44 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 42. 疾患別NGSデータ登録数 2012/12/25現在。 データ取得元:DBCLS SRA http://sra.dbcls.jp/cgi-bin/diseasetree.cgi 45 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 43. Genome Browserとは? • アノテーションが付加された遺伝子のゲノム 上の位置やその周辺を表示できるツール –UCSC Genome Browser http://genome.ucsc.edu/ –Ensembl Genome Browser http://ensembl.org/ 46 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 44. 遺伝子名から検索 47 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 45. 48 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 46. 49 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 47. 50 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 48. 使い方いろいろ。 詳しくは統合TVで • ゲノムアノテーションをカスタマイズする 「UCSC Genome Browserの使い方∼ 表示+ENCODE編∼ 2012」 http://togotv.dbcls.jp/20120528.html • BLATを使って塩基・アミノ酸配列断片から 検索 「ウイルスの持ち出した宿主の遺伝子配列が コードされている領域をアミノ酸配列レベル でゲノム中から探し当てる 2012」 http://togotv.dbcls.jp/20121030.html 51 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 49. 5. 遺伝子発現解析 • NCBI GEO(Gene Expression Omnibus) –GEO目次 • BioGPS • RefEx • Human Protein Atlas 53 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 50. NCBI GEO • Gene Expression Omnibus(GEO) • NCBIによる遺伝子発現情報のアーカイブ –現状、主にマイクロアレイ実験による発現データ –今後、RNA-seqなど次世代シーケンサーによる データが増えてくると見込まれる 「NCBI GEOの使い方1∼マイクロアレイデー タの検索・取得∼ 2011」 http://togotv.dbcls.jp/20110711.html 「NCBI GEOの使い方2∼遺伝子プロファイル の検索・処理済みデータの取得∼」 http://togotv.dbcls.jp/20111020.html 54 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 51. GEO目次 • http://lifesciencedb.jp/geo/ • NCBI GEO を快適に使い、データの全容を 俯瞰するための仕組み • ライフサイエンス統合DBセンター(DBCLS) が提供。週一回更新。 「遺伝子発現バンク(GEO)目次を使い倒す 2010」 http://togotv.dbcls.jp/20100326.html 55 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 52. GEO 目次 56 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 53. BioGPS • http://biogps.org/ • GeneChipを用いたヒト、マウス、ラットの さまざまな組織や細胞(株)における遺伝子発 現プロファイルのデータベース • 英語版Wikipedia(Gene Wiki)等、様々な外部 データベースへのリンクが充実 「遺伝子発現プロファイルデータベース BioGPSを使い倒す 2012」 http://togotv.dbcls.jp/20120911.html 57 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 54. BioGPS検索例: ‘pparg’ 58 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 55. 59 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 56. RefEx (Reference Expression dataset) •http://refex.dbcls.jp/ 4つの異なる実験手法(EST、GeneChip、 CAGE、RNA-seq)によって得られた40種類 の正常組織における遺伝子発現データを統合 し並列に表現することで、手法間の比較とと もに各遺伝子の発現量を直感的に比較するこ とが可能なリファレンス(参照)データセット 作成中…‘RefEx’で以下のフォームから検索 http://togotv-curated.dbcls.jp/ 60 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 57. RefEx 61 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 58. RefEx liver specific genes 62 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 59. RefEx: Specific gene 63 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 60. Human Protein Atlas • http://www.proteinatlas.org/ • 14,079 genes with protein expression profiles based on 17,298 antibodies. ESR1 「Human Protein Atlasでタンパク質の発現状 況を調べる2011」 http://togotv.dbcls.jp/20110113.html 64 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 61. Human Protein Atlas 検索例: ‘ESR1’ 65 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 62. 66 © 2012 DBCLS Licensed under CC 表示 2.1 日本
  • 63. まとめ • バイオインフォマティクスは –「道具」として21世紀の医学生物学に必須 –「道具」「部品」ともに勃興が著しい • 最新の「部品」情報をインターネット検索 を駆使して把握し、「道具」の原理をある程 度理解して、使い倒しましょう! • 復習はこのアイコンを目印に! 統合TVによる統合TV(統合TV Curated)の使い方 http://togotv.dbcls.jp/20110406.html 67 © 2012 DBCLS Licensed under CC 表示 2.1 日本