Psiver j
- 1. 方法開発の背景と目的
多くのタンパク質は,他のタンパク質と相互作用することで生物学的な機能を果
たしている
タンパク質の相互作用部位の同定は,様々なタンパク質の生物学的な機能解明に
大いに役立つ
創薬研究の手助けにもなる(創薬標的分子の同定、阻害剤などの結合部位同定等)
既に幾つか予測法が開発されているが、予測性能が高くない
例
ISIS (Ofran and Rost, 2007) … 現在、利用不可?
- 1,134配列(333 トランジェントタンパク質)を利用して予測モデル開発
- 相互作用するアミノ酸残基の定義… 原子間距離に基づく(6.0Å以下)
SPPIDER (Porollo and Meller, 2007)
- 436配列(262 ヘテロタンパク質, 173 ホモタンパク質)
- 相互作用するアミノ酸残基の定義… 溶媒接触面積に基づく(5.0Å2以上)
トランジェントなヘテロタンパク質を標的とした、より精度の高いタンパク質
相互作用部位の新規予測法の開発したい!
- 2. PDBからのデータセットの構築
データセットの準備
PDB (Protein Data Bank)からトランジェントなヘテロ二量体タンパク質のデータ
のみを取得
105のタンパク質から,配列類似度が25%以下の186の配列を得る
186配列セットを訓練データセットとして、予測モデルを構築する
相互作用するアミノ酸残基の定義
アミノ酸残基の溶媒接触面積が1.0Å2以上のとき、その残基は「相互作用する」と
定義する(Jones and Thornton, 1996)
137,094 残基中,5,478 残基(14.8%) は他のタンパク質と相互作用する残基
アミノ酸残基
溶媒接触面積≧1.0Å2
ヘテロ二量体単量体
- 3. PSIVERのアルゴリズム
入力= 標的となるアミノ酸残基を中心とする部分配列
…LIISKYPVSF TKEQSAQAA QWESVLKS…
位置特異的スコア行列
に基づく単純ベイズ分類器
予測した溶媒接触面積
に基づく単純ベイズ分類器
スコア= { σ(確率比率1) + σ(確率比率2) } / 2
σ : シグモイド関数
スコア≥ θ ならば、「相互作用する」と予測。
そうでなければ,「相互作用しない」と予測。
フィルタリング
次のアミノ酸残基へ
確率比率1 確率比率2
単純ベイズ分類器
独立性を仮定し、ベイズの定理に基づいた
確率モデル
クラス付け(教師あり; 例、相互作用する/
しない)された訓練データセットを用いて
確率モデルを作成
NBCの出力は、”相互作用する”クラスの事
後確率を”相互作用しない“クラスの事後確
率で割った確率比率
スコア
2つの分類器から出力された確率比率をシ
グモイド関数を使って0~1.0に標準化し
て平均化する
フィルタリング
「相互作用する」と予測された残基Aを中心
とするN残基の部分配列内に、「相互作用す
る」と予測された他の残基がP-1個以下の場
合、残基Aを「相互作用しない」と予測
- 4. ベンチマークの結果と他の方法との比較
ドッキングベンチマークセット(version 3.0; Hwang et al., 2008)から作成した72のアミノ酸配列をテ
ストデータセットして、他の方法との性能比較を行った。
Models MCC Precision (%) Recall (%) SP (%) ACC (%) F値(%)
PSIVER
(Murakami and Mizuguchi, 2010)
0.135 25.0 46.5 69.3 66.1 32.5
ISIS
(Ofran and Rost, 2007)
0.091 21.0 35.0 76.2 70.9 26.3
SPPIDER
(Porollo amd Meller, 2007)
0.081 20.4 45.4 64.7 61.7 24.6
Models MCC Precision Recall SP ACC
Chain E (244 residues) – Uracil-DNA Glycosylase
PSIVER 0.436 32.5 90.0 72.7 74.9
ISIS 0.028 14.3 31.0 72.7 67.4
SPPIDER 0.217 32.1 31.0 90.4 82.8
Chain I (83 residues) – Uracil-DNA Glycosylase inhibitor protein
PSIVER 0.310 51.2 70.0 62.3 65.1
ISIS 0.009 37.5 10.0 90.6 61.5
SPPIDER 0.083 36.6 100.0 1.9 37.4
予測例
- 5. Webサーバ
Protein-Protein Interaction Sites Prediction Server
http://mizuguchilab.org/PSIVER/
PSIVERへの入力
• FASTAフォーマットのアミノ酸配列
• 10配列まで同時に入力可能
• 配列データファイルのアップロード機能
• E-mailによる予測結果の通知