More Related Content
Similar to NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」 (20)
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
- 9. 汎用解析環境
NGS解析
核酸配列
解析
タンパク
配列解析
マイクロ
アレイ
ワーク
フロー
実験
支援
配布形態
Bio
Linux
◯
◯
◯
ー
ー
△
VM
/
ISO
file
for
install
media
Galaxy
◯
◯
◯
ー
◯
△
ソースコード
/
Cloud
instance
GenePaDern
△
ー
ー
◯
ー
ー
パッケージ
(Mac,
Linuxのみ)
Chipster
◯
◯
◯
◯
◯
ー
VM
(サーバ)
Java(クライアント)
UGENE
◯
◯
◯
◯
◯
◯
パッケージソフト(Win
/
Mac
/
Linux)
- 13. BioLinuxを起動するまでの作業
• Virtual
Boxをダウンロードしインストール(7分)
• BioLinuxのダウンロード(3.3GB=約25分)
• BioLinuxのインストール(約20分)~その後の設定もろもろ
(5分)
「(Rで)塩基配列解析」でお
馴染みの東京大学大学院農学生命
科学研究科 門田幸二さんらの、日
本乳酸菌学会誌連載の資料を、ガッ
ツリ参考にさせていただきました!
hDp://www.iu.a.u-‐tokyo.ac.jp/~kadota/book/JSLAB2_VirtualBox_win.pdf
hDp://www.iu.a.u-‐tokyo.ac.jp/~kadota/book/JSLAB2_BioLinux8_iso_win.pdf
- 18. Galaxyチュートリアルはたくさんあります!
• 本家
– hDps://usegalaxy.org/
• GalaxyによるNGS解析(DBCLS大田さん)
– hDps://github.com/inutano/training/tree/master/ajacs-‐advanced-‐01
– hDps://www.youtube.com/watch?v=CHCJVN-‐d9qo
• DBCLSのGalaxy(統合TVリンク多数)
– hDp://galaxy.dbcls.jp/
• Galaxy
Workshop
Tokyo
2015(Community
Galaxyパッケージ)
– hDp://wiki.pitagora-‐galaxy.org/wiki/index.php/
Galaxy_Workshop_Tokyo_2015
などなど、他にも目的別チュートリアルも多数
- 19. Galaxyチュートリアルはたくさんあります!
• 本家
– hDps://usegalaxy.org/
• GalaxyによるNGS解析(DBCLS大田さん)
– hDps://github.com/inutano/training/tree/master/ajacs-‐advanced-‐01
– hDps://www.youtube.com/watch?v=CHCJVN-‐d9qo
• DBCLSのGalaxy(統合TVリンク多数)
– hDp://galaxy.dbcls.jp/
• Galaxy
Workshop
Tokyo
2015(Community
Galaxyパッケージ)
– hDp://wiki.pitagora-‐galaxy.org/wiki/index.php/
Galaxy_Workshop_Tokyo_2015
などなど、他にも目的別チュートリアルも多数
使い方は自習しましょう!
- 21. Virtual
Machineとして入手可能な
各種アプリケーション別解析パイプライン
解析パイプライン
生物種
解析内容
UI
MyPro
hDp://sb.nhri.org.tw/MyPro/index.html
微生物
バクテリア全ゲノムシーケンスデータの
De
novo
アセンブ
リーからアノテーション解析
CUI
CloVR-‐Microbe
hDp://clovr.org/methods/clovr-‐microbe/
微生物
バクテリア全ゲノムシーケンスデータの
De
novo
アセンブ
リーからアノテーション解析
GUI
CUI
CloVR-‐16S
hDp://clovr.org
微生物
(メタ16S)
メタ16Sアンプリコンシーケンスデータの菌叢解析
GUI
CUI
TREVA
hDp://bioinforma]cs.petermac.org/treva/
ヒト、マウス
エクソーム、ターゲットシーケンスデータのマッピング解析、
SNV,
Indel,
CNV解析(生殖細胞、体細胞変異)
CUI
MAP-‐Rseq
hDp://bioinforma]cstools.mayo.edu/
research/maprseq/
ヒト
RNA-‐seqデータのマッピング解析、SNV解析、発現量解析、
融合遺伝子解析
CUI
CAP-‐miRSeq
hDp://bioinforma]cstools.mayo.edu/
research/cap-‐mirseq/
ヒト、マウス
miRNA-‐seqデータのマッピング解析、既知microRNA、新規
microRNAアノテーション解析、SNV解析、発現量解析、発
現変動遺伝子解析
CUI
HiChIP
hDp://bioinforma]cstools.mayo.edu/
research/hichipseq-‐pipeline/
ヒト、マウス
ChIP-‐seqデータのマッピング解析、ピーク検出、モチーフ
検出、GO解析
CUI
SV-‐AUTOPILOT
hDps://bioimg.org/sv-‐autopilot
任意
ゲノムシーケンスデータのマッピング解析、構造変異解析
CUI
- 24. Virtual
Machineとして入手可能な
各種アプリケーション別解析パイプライン
• 目的に応じて、必要な工程が決められていて、インプット/ア
ウトプットがわかりやすい
• 説明資料が豊富なことが多い(必要なコマンドの解説など)
• 既存のパイプライン以外のことをしようとすると、設定がむず
かしい
• 含まれる個別のツールのライセンス形態が統一されていな
い
アカデミックフリー(企業には有償)のものもあるので、
特に企業の利用はライセンス要確認!
- 25. 汎用解析環境
NGS解析
核酸配列
解析
タンパク
配列解析
マイクロ
アレイ
ワーク
フロー
実験
支援
配布形態
Bio
Linux
◯
◯
◯
ー
ー
△
VM
/
ISO
file
for
install
media
Galaxy
◯
◯
◯
ー
◯
△
ソースコード
/
Cloud
instance
GenePaDern
△
ー
ー
◯
ー
ー
パッケージ
(Mac,
Linuxのみ)
Chipster
◯
◯
◯
◯
◯
ー
VM
(サーバ)
Java(クライアント)
UGENE
◯
◯
◯
◯
◯
◯
パッケージソフト(Win
/
Mac
/
Linux)
- 28. UGENE: “It
works
perfectly
on
Windows
,
MacOS,
and
Linux”
• Windows
64bit
full
installer
packageダウンロード(5分)
• ダブルクリックでインストール(約3分)
- 44. 計算時間の例(論文から)
• Variant
calling →15min
– Reference:
hg19
ch11
(UCSC)
– BAM:
ch11
alignment
of
NA20887
(1000
genome
project)
• Tuxedo
pipeline(RNA-‐seq)
→8.5hr
– RNA-‐seq
sample
from
Human
cell
line
2.9
GHz
Intel
processor
4コア
16
GB
RAM
Golosova
et
al,
(2014)
PeerJ,
DOI
10.7717/peerj.644
- 53. GGMを使ってできること
1. NGSデータおよび関連情報の登録・管理
2. データ解析・マイニング
(a)
変異解析
(b)
発現解析
(c)
多サンプル比較
(d)
変異解析、発現解析の統合解析
NGS
DNA-seq, RNA-seq, ChIP-seq etc…
NGS
$
(BAM,$VCF,$BED,$etc.)
$
NGS etc.
Management
Mode
Study
Mode
- 61. HDD USB
GiNeS
3
!
!
!
!
Free 0 0 20GB
Basic 10,000 20,000 20GB
Basic.+.M1op4on 20,000 40,000 40GB
50,000
M
50,000
20GB &
1,000
(2)$
(4)$ $(5)$
$
月々1万円から!!
そもそもそんなに多サンプルのデータをお持ちでない方へ
ゲノム解析クラウドサービス
(ギネス)