SlideShare uma empresa Scribd logo
1 de 18
次世代シーケンス解析サーバー
Reseq解析GUIマニュアル



                                                     v. 3.0
          Copyright © Amelieff Co. Ltd. All Rights Reserved.
次世代シーケンス解析サーバーのご紹介




本サーバーは、次世代シーケンスデータ解析において一般的に
用いられている公開ソフトを中心に構成されています。
     複数サンプルを指定して自動的に解析
     解析結果をわかりやすくレポート
それでは、解析手順をご紹介します。


                    Copyright © Amelieff Co. Ltd. All Rights Reserved.   2
サーバーの起動とログイン

サーバーの電源がOFFの時は、電源ボタンを押して起動して下さい。
 ※通常サーバーの電源は切らないようにしてください




    上記ログイン画面が表示されたらユーザー名と
    パスワードを入力してログインして下さい。
                     Copyright © Amelieff Co. Ltd. All Rights Reserved.   3
端末の起動




デスクトップ上でマウスを右クリックしてください。
メニューの「端末の中に開く」をクリックすると、端末が起動します。


                     Copyright © Amelieff Co. Ltd. All Rights Reserved.   4
解析の準備


ここでは、データ解析を/home/user/analysis で実行します。
以下のコマンドを打って、analysisディレクトリを作成します。




         $ cd             ← 自分のホームディレクトリへ移動
         $ mkdir analysis ← 解析用のanalysisディレクトリを作成
         $ cd analysis/   ← 作成したanalysisディレクトリへ移動


      cp コマンドを用いて、解析したいFastqファイルを
      analysisディレクトリにコピーします。
$ cp /home/share/example/reseq/SRR077861_*.fastq /home/user/analysis

                     ※ディレクトリとはWindowsにおけるフォルダと同じ意味です。
                                               Copyright © Amelieff Co. Ltd. All Rights Reserved.   5
解析の実行


     tsvファイルを作成し、
     端末内に以下のコマンドを入力し解析を実行します。




$ ls -l                 ← コピーができたかどうかの確認
$ python -u /usr/local/src/amelieff/reseq/reseq.py -s 1 -l SRR077861.tsv
  -g hg19 -a > log 2>&1 & ← Reseq 解析プログラムの実行

       詳細は別紙 「Reseq解析フロー」をご覧ください。
       -a オプションを外すとannoverをご利用になれます。
            詳細は「マニュアル別紙 Annovar事前準備」をご覧ください。
                                                   Copyright © Amelieff Co. Ltd. All Rights Reserved.   6
実行状況の確認方法(1)
            実行中のジョブの確認



端末内で、topコマンド
を入力すると実行中の
ジョブが確認できます。
   $ top


右の例ではuser の bwa
ジョブが流れています。



このtop画面を終了するときは、qを押します。
                          Copyright © Amelieff Co. Ltd. All Rights Reserved.   7
実行状況の確認方法(2)
      出力ファイル・ディレクトリの確認

デスクトップの
userのホーム →
analysis の順に
クリックします。


ディレクトリが5つ、
サマリーファイル
(SRR077861.log)が
1つできていること
を確認します。


                   Copyright © Amelieff Co. Ltd. All Rights Reserved.   8
実行状況の確認方法(3)
    サマリーファイルの確認
  得られたサマリーファイル(SRR077861.log)を
  windowsパソコンにコピーし、Excelで開きます。




サマリーファイルには、5つの解析項目の開始・終了時間と
実行結果の情報が記載されています。
          Copyright © Amelieff Co. Ltd. All Rights Reserved.
                                                               9
実行状況の確認方法(3)
       サマリーファイルの詳細


サマリーファイルのヘッダーには、解析の基本情報が書かれます。
       ###########################################
       #RESEQ PIPELINE START: 2012/12/19-13:17:43                       ①
       # file = SRR077861.tsv                                           ②
       # genome = hg19                                                  ③
       # bed = /home/genome/hg19/ccds.bed                               ④

    ① 解析を始めた時間
    ② 解析の対象となるFastqファイルのリスト
    ③ 解析に使用するリファレンスゲノム
    ④ 集計を行うターゲット領域
      (濃縮キットを使用した場合は販売元にお問い合わせください)

                   Copyright © Amelieff Co. Ltd. All Rights Reserved.
                                                                            10
実行状況の確認方法(3)
サマリーファイルの詳細:Step1(QC結果)


## Step1:1_qc
Num Sample         Start                      End                 Time(sec)
       SRR077861   2012/12/19-13:17:43        2012/12/19-13:17:54        10


                   Info                                                                 Result
                   [SRR077861_1.clean.fastq.gz]Pass_reads/Total_reads                   8641/8707(99.24%)       ①
                   [SRR077861_1.clean.fastq.gz]Pass_bases/Total_bases                   765303/769187(99.50%)   ②
                   [SRR077861_2.clean.fastq.gz]Pass_reads/Total_reads                   8641/8707(99.24%)
                   [SRR077861_2.clean.fastq.gz]Pass_bases/Total_bases                   766170/769287(99.59%)




      ① 全リードのうち、クオリティ・フィルタリングをパスしたリードの割合
      ② 全塩基のうち、クオリティ・フィルタリングをパスした塩基の割合


                                   Copyright © Amelieff Co. Ltd. All Rights Reserved.
                                                                                                                11
実行状況の確認方法(3)
                     サマリーファイルの詳細:
                     Step2(Mapping結果)
## Step2-4:2_mapping,3_realignment,4_snv/indel,5_annotation
# sample = SRR077861
Step Process         Start                   End             Time(sec)
     2 Mapping       2012/12/19-13:17:54 2012/12/19-13:18:08        13
                                         Info                                          Result
                                         Mapped_reads/Pass_reads                       16768/17282(97.03%)   ①
                                         After_duplicate_reads_removed                               16691   ②
                                         Target_num                                                  25504   ③
                                         Target_size                                             937613923   ④
                                         No_covererd_target_num                        25503,99.9%           ⑤
① クオリティ・フィルタリングをパスしたリードのうち、マッピングされたリードの割合
② 重複リードを除外した後のリード数
③ 実行時に指定したターゲット領域に含まれる領域数
                      (未指定の場合はCCDSの領域数)
④ ターゲット領域の大きさ(未指定の場合はCCDSの大きさ)
⑤ リードが1本もマッピングされなかったターゲット領域の数と割合
                                  Copyright © Amelieff Co. Ltd. All Rights Reserved.
                                                                                                                 12
実行状況の確認方法(3)
       サマリーファイルの詳細:
Step2~3(Mapping~Realignment結果)
                      Average_depth(x1)                                           21.7
                                 (x10)                                            82.8
                                 (x30)                                           118.7
                                                                                                ①
                                 (x50)                                           141.9
                      Coverage(x1)                                               0.00%
                      Coverage(x10)                                              0.00%
                      Coverage(x30)                                              0.00%
                                                                                                ②
                      Coverage(x50)                                              0.00%

      ① カバレージ X 以上のターゲット領域上の平均カバレージ
      ② カバレージ X 以上でカバーされているターゲット領域の割合

 3 Realignment   2012/12/19-13:18:08       2012/12/19-13:35:26                           1038

                                                              Regions_local_realignment             76   ③

     ③ ローカルリアライメントを行った領域の数
                                   Copyright © Amelieff Co. Ltd. All Rights Reserved.
                                                                                                         13
実行状況の確認方法(3)
      サマリーファイルの詳細:
Step4~5(SNV/Indel~Annotate結果)
4 SNV/Indel   2012/12/19-13:35:26      2012/12/19-14:25:12                           2985



5 Annotate    2012/12/19-14:25:12      2012/12/19-14:39:52                            880
                                                         SNV                                31   ①
                                                         Indel                               2   ②
                                                         Filtered_SNV                       17   ③
                                                         Filtered_Indel                      2   ④
                                                         # All_Process_End                       ⑤
     ①    検出されたSNV数
     ②    検出されたInsertion/Deletion数
     ③    クオリティのフィルタリングをパスしたSNV数
     ④    クオリティのフィルタリングをパスしたInsertion/Deletion数
     ⑤    1つのサンプルの解析が全て終了
                                Copyright © Amelieff Co. Ltd. All Rights Reserved.
                                                                                                 14
QC結果確認


     Fastqファイル毎にQCの
     レポートが出力されます。


     analysisディレクトリの
     1_qc → tmp →
     SRR077861_1_QCleaner →
     SRR077861_1.clean_fastqc →
     fastqc_report.html
     の順にクリックします。



         Copyright © Amelieff Co. Ltd. All Rights Reserved.   15
QC結果確認




ウェブブラウザでFastQCの結果を確認できます。
                 Copyright © Amelieff Co. Ltd. All Rights Reserved.   16
SNV/Indel検出結果の確認




          analysisディレクトリの
          5_annotation →
          SRR077861_small_snpEff_
          summary.html
          の順にクリックします。




              Copyright © Amelieff Co. Ltd. All Rights Reserved.   17
SNV/Indel検出結果の確認




ウェブブラウザでSNV/Indelの集計結果を確認できます。
                    Copyright © Amelieff Co. Ltd. All Rights Reserved.   18

Mais conteúdo relacionado

Mais procurados

BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"kazuoishii20
 
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料Genaris Omics, Inc.
 
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門Amelieff
 
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料Amelieff
 
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料Amelieff
 
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」Genaris Omics, Inc.
 
ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析Hiromi Kajiya-Kanegae
 
SNPデータ解析入門
SNPデータ解析入門SNPデータ解析入門
SNPデータ解析入門Amelieff
 
Survey and Analysis of ICS Vulnerabilities (Japanese)
Survey and Analysis of ICS Vulnerabilities (Japanese)Survey and Analysis of ICS Vulnerabilities (Japanese)
Survey and Analysis of ICS Vulnerabilities (Japanese)Digital Bond
 
第4回Linux-HA勉強会資料 Pacemakerの紹介
第4回Linux-HA勉強会資料 Pacemakerの紹介第4回Linux-HA勉強会資料 Pacemakerの紹介
第4回Linux-HA勉強会資料 Pacemakerの紹介ksk_ha
 
jcmd をさわってみよう
jcmd をさわってみようjcmd をさわってみよう
jcmd をさわってみようTsunenaga Hanyuda
 
第7回oss貢献者賞 森-20120316
第7回oss貢献者賞 森-20120316第7回oss貢献者賞 森-20120316
第7回oss貢献者賞 森-20120316ksk_ha
 
Pacemaker NextGen OSC2012TokyoFall-20120908
Pacemaker NextGen OSC2012TokyoFall-20120908Pacemaker NextGen OSC2012TokyoFall-20120908
Pacemaker NextGen OSC2012TokyoFall-20120908ksk_ha
 
オープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbixオープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbixKodai Terashima
 
Elasticsearch as a Distributed System
Elasticsearch as a Distributed SystemElasticsearch as a Distributed System
Elasticsearch as a Distributed SystemSatoyuki Tsukano
 

Mais procurados (20)

BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
 
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
 
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門
 
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
 
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
 
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
 
ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析
 
SNPデータ解析入門
SNPデータ解析入門SNPデータ解析入門
SNPデータ解析入門
 
Survey and Analysis of ICS Vulnerabilities (Japanese)
Survey and Analysis of ICS Vulnerabilities (Japanese)Survey and Analysis of ICS Vulnerabilities (Japanese)
Survey and Analysis of ICS Vulnerabilities (Japanese)
 
Reconf 201506
Reconf 201506Reconf 201506
Reconf 201506
 
第4回Linux-HA勉強会資料 Pacemakerの紹介
第4回Linux-HA勉強会資料 Pacemakerの紹介第4回Linux-HA勉強会資料 Pacemakerの紹介
第4回Linux-HA勉強会資料 Pacemakerの紹介
 
V6 unix vol.2 in okinawa
V6 unix vol.2 in okinawaV6 unix vol.2 in okinawa
V6 unix vol.2 in okinawa
 
Ptt391
Ptt391Ptt391
Ptt391
 
jcmd をさわってみよう
jcmd をさわってみようjcmd をさわってみよう
jcmd をさわってみよう
 
第7回oss貢献者賞 森-20120316
第7回oss貢献者賞 森-20120316第7回oss貢献者賞 森-20120316
第7回oss貢献者賞 森-20120316
 
CDH4.0.0のNameNode HAを触ってみて
CDH4.0.0のNameNode HAを触ってみてCDH4.0.0のNameNode HAを触ってみて
CDH4.0.0のNameNode HAを触ってみて
 
hbstudy#06
hbstudy#06hbstudy#06
hbstudy#06
 
Pacemaker NextGen OSC2012TokyoFall-20120908
Pacemaker NextGen OSC2012TokyoFall-20120908Pacemaker NextGen OSC2012TokyoFall-20120908
Pacemaker NextGen OSC2012TokyoFall-20120908
 
オープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbixオープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbix
 
Elasticsearch as a Distributed System
Elasticsearch as a Distributed SystemElasticsearch as a Distributed System
Elasticsearch as a Distributed System
 

Semelhante a 次世代シーケンス解析サーバーReseq解析マニュアル

Hadoopソースコードリーディング8/MapRを使ってみた
Hadoopソースコードリーディング8/MapRを使ってみたHadoopソースコードリーディング8/MapRを使ってみた
Hadoopソースコードリーディング8/MapRを使ってみたRecruit Technologies
 
Rのデータ構造とメモリ管理
Rのデータ構造とメモリ管理Rのデータ構造とメモリ管理
Rのデータ構造とメモリ管理Takeshi Arabiki
 
cloudpack負荷職人結果レポート(サンプル)
cloudpack負荷職人結果レポート(サンプル)cloudpack負荷職人結果レポート(サンプル)
cloudpack負荷職人結果レポート(サンプル)iret, Inc.
 
LoRaWAN 距離検出センサ LDDS75 日本語マニュアル
LoRaWAN 距離検出センサ LDDS75 日本語マニュアルLoRaWAN 距離検出センサ LDDS75 日本語マニュアル
LoRaWAN 距離検出センサ LDDS75 日本語マニュアルCRI Japan, Inc.
 
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展Recruit Technologies
 
文献紹介:SegFormer: Simple and Efficient Design for Semantic Segmentation with Tr...
文献紹介:SegFormer: Simple and Efficient Design for Semantic Segmentation with Tr...文献紹介:SegFormer: Simple and Efficient Design for Semantic Segmentation with Tr...
文献紹介:SegFormer: Simple and Efficient Design for Semantic Segmentation with Tr...Toru Tamaki
 
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11MapR Technologies Japan
 
Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14Masahiro Nagano
 
Android程序的编译,安装和运行 | 小米科技 汪文俊
Android程序的编译,安装和运行 | 小米科技 汪文俊Android程序的编译,安装和运行 | 小米科技 汪文俊
Android程序的编译,安装和运行 | 小米科技 汪文俊imShining @DevCamp
 
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例外道 父
 
配布用Beginnerならきっと役立つmaster slave環境
配布用Beginnerならきっと役立つmaster slave環境配布用Beginnerならきっと役立つmaster slave環境
配布用Beginnerならきっと役立つmaster slave環境yut148atgmaildotcom
 
第1回『いまさら聞けない!システム運用・管理のコツ』 『クラウド管理・運用サービス「E.C.O」のご紹介』
第1回『いまさら聞けない!システム運用・管理のコツ』 『クラウド管理・運用サービス「E.C.O」のご紹介』第1回『いまさら聞けない!システム運用・管理のコツ』 『クラウド管理・運用サービス「E.C.O」のご紹介』
第1回『いまさら聞けない!システム運用・管理のコツ』 『クラウド管理・運用サービス「E.C.O」のご紹介』Naoya Hashimoto
 
Shusei tomonaga pac_sec_20171026_jp
Shusei tomonaga pac_sec_20171026_jpShusei tomonaga pac_sec_20171026_jp
Shusei tomonaga pac_sec_20171026_jpPacSecJP
 
2012-04-25 ASPLOS2012出張報告(公開版)
2012-04-25 ASPLOS2012出張報告(公開版)2012-04-25 ASPLOS2012出張報告(公開版)
2012-04-25 ASPLOS2012出張報告(公開版)Takahiro Shinagawa
 
巨大ポータルを支えるプライベート・クラウド構築事例から学べ!~攻める情シスのためのインフラ構築、その極意とは?~
巨大ポータルを支えるプライベート・クラウド構築事例から学べ!~攻める情シスのためのインフラ構築、その極意とは?~巨大ポータルを支えるプライベート・クラウド構築事例から学べ!~攻める情シスのためのインフラ構築、その極意とは?~
巨大ポータルを支えるプライベート・クラウド構築事例から学べ!~攻める情シスのためのインフラ構築、その極意とは?~Brocade
 
SAS Visual Analytics 6.3 を使った DELL VRTX の評価
SAS Visual Analytics 6.3 を使った DELL VRTX の評価SAS Visual Analytics 6.3 を使った DELL VRTX の評価
SAS Visual Analytics 6.3 を使った DELL VRTX の評価Dell TechCenter Japan
 
Gangliaはじめました
GangliaはじめましたGangliaはじめました
Gangliaはじめましたyuzorock
 

Semelhante a 次世代シーケンス解析サーバーReseq解析マニュアル (20)

Hadoopソースコードリーディング8/MapRを使ってみた
Hadoopソースコードリーディング8/MapRを使ってみたHadoopソースコードリーディング8/MapRを使ってみた
Hadoopソースコードリーディング8/MapRを使ってみた
 
Apache Hadoopの未来 3系になって何が変わるのか?
Apache Hadoopの未来 3系になって何が変わるのか?Apache Hadoopの未来 3系になって何が変わるのか?
Apache Hadoopの未来 3系になって何が変わるのか?
 
Rのデータ構造とメモリ管理
Rのデータ構造とメモリ管理Rのデータ構造とメモリ管理
Rのデータ構造とメモリ管理
 
MySQL Partition Engine
MySQL Partition EngineMySQL Partition Engine
MySQL Partition Engine
 
cloudpack負荷職人結果レポート(サンプル)
cloudpack負荷職人結果レポート(サンプル)cloudpack負荷職人結果レポート(サンプル)
cloudpack負荷職人結果レポート(サンプル)
 
osoljp 2011.08
osoljp 2011.08osoljp 2011.08
osoljp 2011.08
 
LoRaWAN 距離検出センサ LDDS75 日本語マニュアル
LoRaWAN 距離検出センサ LDDS75 日本語マニュアルLoRaWAN 距離検出センサ LDDS75 日本語マニュアル
LoRaWAN 距離検出センサ LDDS75 日本語マニュアル
 
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
 
文献紹介:SegFormer: Simple and Efficient Design for Semantic Segmentation with Tr...
文献紹介:SegFormer: Simple and Efficient Design for Semantic Segmentation with Tr...文献紹介:SegFormer: Simple and Efficient Design for Semantic Segmentation with Tr...
文献紹介:SegFormer: Simple and Efficient Design for Semantic Segmentation with Tr...
 
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
 
Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14
 
Android程序的编译,安装和运行 | 小米科技 汪文俊
Android程序的编译,安装和运行 | 小米科技 汪文俊Android程序的编译,安装和运行 | 小米科技 汪文俊
Android程序的编译,安装和运行 | 小米科技 汪文俊
 
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
Fluentd Meetup #2 @外道父 Fluentdを優しく見守る監視事例
 
配布用Beginnerならきっと役立つmaster slave環境
配布用Beginnerならきっと役立つmaster slave環境配布用Beginnerならきっと役立つmaster slave環境
配布用Beginnerならきっと役立つmaster slave環境
 
第1回『いまさら聞けない!システム運用・管理のコツ』 『クラウド管理・運用サービス「E.C.O」のご紹介』
第1回『いまさら聞けない!システム運用・管理のコツ』 『クラウド管理・運用サービス「E.C.O」のご紹介』第1回『いまさら聞けない!システム運用・管理のコツ』 『クラウド管理・運用サービス「E.C.O」のご紹介』
第1回『いまさら聞けない!システム運用・管理のコツ』 『クラウド管理・運用サービス「E.C.O」のご紹介』
 
Shusei tomonaga pac_sec_20171026_jp
Shusei tomonaga pac_sec_20171026_jpShusei tomonaga pac_sec_20171026_jp
Shusei tomonaga pac_sec_20171026_jp
 
2012-04-25 ASPLOS2012出張報告(公開版)
2012-04-25 ASPLOS2012出張報告(公開版)2012-04-25 ASPLOS2012出張報告(公開版)
2012-04-25 ASPLOS2012出張報告(公開版)
 
巨大ポータルを支えるプライベート・クラウド構築事例から学べ!~攻める情シスのためのインフラ構築、その極意とは?~
巨大ポータルを支えるプライベート・クラウド構築事例から学べ!~攻める情シスのためのインフラ構築、その極意とは?~巨大ポータルを支えるプライベート・クラウド構築事例から学べ!~攻める情シスのためのインフラ構築、その極意とは?~
巨大ポータルを支えるプライベート・クラウド構築事例から学べ!~攻める情シスのためのインフラ構築、その極意とは?~
 
SAS Visual Analytics 6.3 を使った DELL VRTX の評価
SAS Visual Analytics 6.3 を使った DELL VRTX の評価SAS Visual Analytics 6.3 を使った DELL VRTX の評価
SAS Visual Analytics 6.3 を使った DELL VRTX の評価
 
Gangliaはじめました
GangliaはじめましたGangliaはじめました
Gangliaはじめました
 

次世代シーケンス解析サーバーReseq解析マニュアル

  • 1. 次世代シーケンス解析サーバー Reseq解析GUIマニュアル v. 3.0 Copyright © Amelieff Co. Ltd. All Rights Reserved.
  • 2. 次世代シーケンス解析サーバーのご紹介 本サーバーは、次世代シーケンスデータ解析において一般的に 用いられている公開ソフトを中心に構成されています。  複数サンプルを指定して自動的に解析  解析結果をわかりやすくレポート それでは、解析手順をご紹介します。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 2
  • 3. サーバーの起動とログイン サーバーの電源がOFFの時は、電源ボタンを押して起動して下さい。 ※通常サーバーの電源は切らないようにしてください 上記ログイン画面が表示されたらユーザー名と パスワードを入力してログインして下さい。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 3
  • 5. 解析の準備 ここでは、データ解析を/home/user/analysis で実行します。 以下のコマンドを打って、analysisディレクトリを作成します。 $ cd ← 自分のホームディレクトリへ移動 $ mkdir analysis ← 解析用のanalysisディレクトリを作成 $ cd analysis/ ← 作成したanalysisディレクトリへ移動 cp コマンドを用いて、解析したいFastqファイルを analysisディレクトリにコピーします。 $ cp /home/share/example/reseq/SRR077861_*.fastq /home/user/analysis ※ディレクトリとはWindowsにおけるフォルダと同じ意味です。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 5
  • 6. 解析の実行 tsvファイルを作成し、 端末内に以下のコマンドを入力し解析を実行します。 $ ls -l ← コピーができたかどうかの確認 $ python -u /usr/local/src/amelieff/reseq/reseq.py -s 1 -l SRR077861.tsv -g hg19 -a > log 2>&1 & ← Reseq 解析プログラムの実行  詳細は別紙 「Reseq解析フロー」をご覧ください。  -a オプションを外すとannoverをご利用になれます。 詳細は「マニュアル別紙 Annovar事前準備」をご覧ください。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 6
  • 7. 実行状況の確認方法(1) 実行中のジョブの確認 端末内で、topコマンド を入力すると実行中の ジョブが確認できます。 $ top 右の例ではuser の bwa ジョブが流れています。 このtop画面を終了するときは、qを押します。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 7
  • 8. 実行状況の確認方法(2) 出力ファイル・ディレクトリの確認 デスクトップの userのホーム → analysis の順に クリックします。 ディレクトリが5つ、 サマリーファイル (SRR077861.log)が 1つできていること を確認します。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 8
  • 9. 実行状況の確認方法(3) サマリーファイルの確認 得られたサマリーファイル(SRR077861.log)を windowsパソコンにコピーし、Excelで開きます。 サマリーファイルには、5つの解析項目の開始・終了時間と 実行結果の情報が記載されています。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 9
  • 10. 実行状況の確認方法(3) サマリーファイルの詳細 サマリーファイルのヘッダーには、解析の基本情報が書かれます。 ########################################### #RESEQ PIPELINE START: 2012/12/19-13:17:43 ① # file = SRR077861.tsv ② # genome = hg19 ③ # bed = /home/genome/hg19/ccds.bed ④ ① 解析を始めた時間 ② 解析の対象となるFastqファイルのリスト ③ 解析に使用するリファレンスゲノム ④ 集計を行うターゲット領域 (濃縮キットを使用した場合は販売元にお問い合わせください) Copyright © Amelieff Co. Ltd. All Rights Reserved. 10
  • 11. 実行状況の確認方法(3) サマリーファイルの詳細:Step1(QC結果) ## Step1:1_qc Num Sample Start End Time(sec) SRR077861 2012/12/19-13:17:43 2012/12/19-13:17:54 10 Info Result [SRR077861_1.clean.fastq.gz]Pass_reads/Total_reads 8641/8707(99.24%) ① [SRR077861_1.clean.fastq.gz]Pass_bases/Total_bases 765303/769187(99.50%) ② [SRR077861_2.clean.fastq.gz]Pass_reads/Total_reads 8641/8707(99.24%) [SRR077861_2.clean.fastq.gz]Pass_bases/Total_bases 766170/769287(99.59%) ① 全リードのうち、クオリティ・フィルタリングをパスしたリードの割合 ② 全塩基のうち、クオリティ・フィルタリングをパスした塩基の割合 Copyright © Amelieff Co. Ltd. All Rights Reserved. 11
  • 12. 実行状況の確認方法(3) サマリーファイルの詳細: Step2(Mapping結果) ## Step2-4:2_mapping,3_realignment,4_snv/indel,5_annotation # sample = SRR077861 Step Process Start End Time(sec) 2 Mapping 2012/12/19-13:17:54 2012/12/19-13:18:08 13 Info Result Mapped_reads/Pass_reads 16768/17282(97.03%) ① After_duplicate_reads_removed 16691 ② Target_num 25504 ③ Target_size 937613923 ④ No_covererd_target_num 25503,99.9% ⑤ ① クオリティ・フィルタリングをパスしたリードのうち、マッピングされたリードの割合 ② 重複リードを除外した後のリード数 ③ 実行時に指定したターゲット領域に含まれる領域数 (未指定の場合はCCDSの領域数) ④ ターゲット領域の大きさ(未指定の場合はCCDSの大きさ) ⑤ リードが1本もマッピングされなかったターゲット領域の数と割合 Copyright © Amelieff Co. Ltd. All Rights Reserved. 12
  • 13. 実行状況の確認方法(3) サマリーファイルの詳細: Step2~3(Mapping~Realignment結果) Average_depth(x1) 21.7 (x10) 82.8 (x30) 118.7 ① (x50) 141.9 Coverage(x1) 0.00% Coverage(x10) 0.00% Coverage(x30) 0.00% ② Coverage(x50) 0.00% ① カバレージ X 以上のターゲット領域上の平均カバレージ ② カバレージ X 以上でカバーされているターゲット領域の割合 3 Realignment 2012/12/19-13:18:08 2012/12/19-13:35:26 1038 Regions_local_realignment 76 ③ ③ ローカルリアライメントを行った領域の数 Copyright © Amelieff Co. Ltd. All Rights Reserved. 13
  • 14. 実行状況の確認方法(3) サマリーファイルの詳細: Step4~5(SNV/Indel~Annotate結果) 4 SNV/Indel 2012/12/19-13:35:26 2012/12/19-14:25:12 2985 5 Annotate 2012/12/19-14:25:12 2012/12/19-14:39:52 880 SNV 31 ① Indel 2 ② Filtered_SNV 17 ③ Filtered_Indel 2 ④ # All_Process_End ⑤ ① 検出されたSNV数 ② 検出されたInsertion/Deletion数 ③ クオリティのフィルタリングをパスしたSNV数 ④ クオリティのフィルタリングをパスしたInsertion/Deletion数 ⑤ 1つのサンプルの解析が全て終了 Copyright © Amelieff Co. Ltd. All Rights Reserved. 14
  • 15. QC結果確認 Fastqファイル毎にQCの レポートが出力されます。 analysisディレクトリの 1_qc → tmp → SRR077861_1_QCleaner → SRR077861_1.clean_fastqc → fastqc_report.html の順にクリックします。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 15
  • 16. QC結果確認 ウェブブラウザでFastQCの結果を確認できます。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 16
  • 17. SNV/Indel検出結果の確認 analysisディレクトリの 5_annotation → SRR077861_small_snpEff_ summary.html の順にクリックします。 Copyright © Amelieff Co. Ltd. All Rights Reserved. 17