SlideShare uma empresa Scribd logo
1 de 42
Baixar para ler offline
RDKitの紹介
iwatobipen
• 今日はきっかけになればってレベルで。
What is RDKit ?
●オープンソースのchemoinfo tool kitです。
-コアの部分はC++だから早いよ。
-Python2.x ラッパーあるよ。
-機械学習用の記述子色々あるよ。
-カートリッジサポートしてるよ。( PostgreSQL )
●扱い
-OS win/mac/linux サポート。
-GitHubでバージョン管理。
-ML結構活発。
Install
Linux: apt-getとか。Yumは調べてないです。
Windows: 32bit/64bit binariesでOK !
Mac: Homebrew
IPython & PANDAS
幸せの形
Macならこの辺が良いかと
Winはバイナリがある。
http://fonnesbeck.github.io/ScipySuperpack/
サンプルデータ
まず読む
114分子読みました。
IPythonConsole使うと分子が
インタラクティブに見えまーす
ここで少しデモ
タイポ、躓きはご容赦を
駆け足でDIY感のある
MMP & Graphics
Test Data
>python rfrag.py < input.txt > frag.txt
>python indexing.py < frag.txt > pair.txt
ある日のメール
やあみんな。
いくつかmmpの機能を追加したよ。
mol_transform.pyはユーザーが
セットしたSmilesにMMPを適用して
変換するんだ。(超適当)
Hi all, I have added some extra parts to the mmpa contrib.
code which has recently been approved for open sourcing by GSK.
Also, I have made some minor changes to the existing code
but it should all work in the same way.
The extra parts are: mol_transform.py This program applies a transform or transforms
(generated by the MMP generation program) and applies it to a user set of smiles.
This final piece completes the circle, so now you can find MMPs,、、、、、
Transform
( ゚∀゚ )キタ━━━!!!)
さっそくデータ準備
無駄にPANDASを使ってみる。
>python mol_transform.py -f only_pair.txt < beore.txt > after.txt
実行スクリプト ペアファイル 入力 出力
劇的 ビフォー アフター?
できた♪
MMP DB
簡単につくれたらいーねー♪
あるよ
create_mmp_db.py
https://github.com/rdkit/rdkit/tree/master/Contrib/mmpa
>python create_mmp_db.py < your_fragment.txt
これでどうだ!
mmp.dbというファイルができる(sqlite3)
テーブルが四つ出来た
化合物情報入ってる
活用部分
はこれから、、、
次はビジュアル系
某社のTool kit 素敵。
原子の寄与を考えて可視化している
あるある!
matplotlibも必要ですが
APIほぼ丸写しでOK。
カラーマップ指定
contourの荒さ
>python mol_viz.py crizotinib.mol
動け!
こんな感じのビューができます。
Similarity mapも最近報告されてます
FingerPrintの類似性を可視化も可能。
まとめ
Pythonベースで色々できる。
PANDAS/matplotlib/Scikit-learnとの四重奏?
機能はかなりリッチ。
開発が活発。
UGRMの資料もオープンです。
その他
配座発生、ROCS的な扱いもOK
何よりOSS。CADDチームのリソースを侵食しない
御礼
つたない発表にお付き合いいただき
ありがとうございました。
追加リファレンス
順不同/全部じゃない
USRCAT: real-time ultrafast shape recognition with pharmacophoric constraints
http://www.jcheminf.com/content/4/1/27/abstract
Similarity maps - a visualization strategy for molecular fingerprints
and machine-learning methods
http://www.jcheminf.com/content/5/1/43/abstract
hERG Me Out
http://pubs.acs.org/doi/abs/10.1021/ci400308z
Freely Available Conformer Generation Methods: How Good Are They?
http://pubs.acs.org/doi/abs/10.1021/ci2004658
Similarity Boosted Quantitative Structure–Activity Relationship—
A Systematic Study of Enhancing Structural Descriptors by Molecular Similarity
http://pubs.acs.org/doi/abs/10.1021/ci300182p
A Collection of Robust Organic Synthesis Reactions for In Silico Molecule Design
http://pubs.acs.org/doi/abs/10.1021/ci200379p
参考URL
APIリファレンス
http://www.rdkit.org/docs/index.html
ユーザーミーティングスライド おすすめ。
http://www.rdkit.org/UGM/2012/
Wiki
http://code.google.com/p/rdkit/w/list

Mais conteúdo relacionado

Mais procurados

不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
Haruka Ozaki
 

Mais procurados (20)

PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
 
Recent Advances on Transfer Learning and Related Topics Ver.2
Recent Advances on Transfer Learning and Related Topics Ver.2Recent Advances on Transfer Learning and Related Topics Ver.2
Recent Advances on Transfer Learning and Related Topics Ver.2
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話
 
TabNetの論文紹介
TabNetの論文紹介TabNetの論文紹介
TabNetの論文紹介
 
合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
 
[DL輪読会]Temporal DifferenceVariationalAuto-Encoder
[DL輪読会]Temporal DifferenceVariationalAuto-Encoder[DL輪読会]Temporal DifferenceVariationalAuto-Encoder
[DL輪読会]Temporal DifferenceVariationalAuto-Encoder
 
ブラックボックス最適化とその応用
ブラックボックス最適化とその応用ブラックボックス最適化とその応用
ブラックボックス最適化とその応用
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
 
Stochastic Gradient MCMC
Stochastic Gradient MCMCStochastic Gradient MCMC
Stochastic Gradient MCMC
 
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
 
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
 
学振特別研究員になるために~2024年度申請版
 学振特別研究員になるために~2024年度申請版 学振特別研究員になるために~2024年度申請版
学振特別研究員になるために~2024年度申請版
 
学位論文の書き方メモ (Tips for writing thesis)
学位論文の書き方メモ (Tips for writing thesis)学位論文の書き方メモ (Tips for writing thesis)
学位論文の書き方メモ (Tips for writing thesis)
 
[DL輪読会]Deep Learning 第5章 機械学習の基礎
[DL輪読会]Deep Learning 第5章 機械学習の基礎[DL輪読会]Deep Learning 第5章 機械学習の基礎
[DL輪読会]Deep Learning 第5章 機械学習の基礎
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
 
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
 
GAN(と強化学習との関係)
GAN(と強化学習との関係)GAN(と強化学習との関係)
GAN(と強化学習との関係)
 

Destaque

主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
Y-h Taguchi
 

Destaque (20)

Retailer 01-2013-preview
Retailer 01-2013-previewRetailer 01-2013-preview
Retailer 01-2013-preview
 
FAMSとchooseLDを用いたインシリコ創薬パイプライン
FAMSとchooseLDを用いたインシリコ創薬パイプラインFAMSとchooseLDを用いたインシリコ創薬パイプライン
FAMSとchooseLDを用いたインシリコ創薬パイプライン
 
mishimasyk#4
mishimasyk#4mishimasyk#4
mishimasyk#4
 
Mishimasyk141025
Mishimasyk141025Mishimasyk141025
Mishimasyk141025
 
R -> Python
R -> PythonR -> Python
R -> Python
 
目指せヘルシープログラマ!
目指せヘルシープログラマ!目指せヘルシープログラマ!
目指せヘルシープログラマ!
 
Level dbを試した
Level dbを試したLevel dbを試した
Level dbを試した
 
Mishimasyk6 iwatobipen
Mishimasyk6 iwatobipenMishimasyk6 iwatobipen
Mishimasyk6 iwatobipen
 
201310slide day1
201310slide day1201310slide day1
201310slide day1
 
Mishimasyk 3 20140705
Mishimasyk 3 20140705Mishimasyk 3 20140705
Mishimasyk 3 20140705
 
Mishimasyk5 chemomine up
Mishimasyk5 chemomine upMishimasyk5 chemomine up
Mishimasyk5 chemomine up
 
Mishimasyk
MishimasykMishimasyk
Mishimasyk
 
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
 
IPython notebookを使おう
IPython notebookを使おうIPython notebookを使おう
IPython notebookを使おう
 
あまり知られていない静岡の言語戦争の歴史
あまり知られていない静岡の言語戦争の歴史あまり知られていない静岡の言語戦争の歴史
あまり知られていない静岡の言語戦争の歴史
 
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
 
10分でわかるRandom forest
10分でわかるRandom forest10分でわかるRandom forest
10分でわかるRandom forest
 
RDKit Gems
RDKit GemsRDKit Gems
RDKit Gems
 
機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論
 
ランダムフォレスト
ランダムフォレストランダムフォレスト
ランダムフォレスト
 

Semelhante a Rdkitの紹介

次世代言語 Python による PyPy を使った次世代の処理系開発
次世代言語 Python による PyPy を使った次世代の処理系開発次世代言語 Python による PyPy を使った次世代の処理系開発
次世代言語 Python による PyPy を使った次世代の処理系開発
shoma h
 
今最もアツイdistribution Gentoo Linuxについて
今最もアツイdistribution Gentoo Linuxについて今最もアツイdistribution Gentoo Linuxについて
今最もアツイdistribution Gentoo Linuxについて
Takuto Matsuu
 
Windowsにpythonをインストールしてみよう
WindowsにpythonをインストールしてみようWindowsにpythonをインストールしてみよう
Windowsにpythonをインストールしてみよう
Kenji NAKAGAKI
 
Python3 プログラミング勉強会
Python3 プログラミング勉強会Python3 プログラミング勉強会
Python3 プログラミング勉強会
Tetsuya Morimoto
 
Pythonの環境導入 2014年春季版
Pythonの環境導入 2014年春季版Pythonの環境導入 2014年春季版
Pythonの環境導入 2014年春季版
Katsuhiro Morishita
 
griffon plugin を 実際に作ってみよう #jggug
griffon plugin を 実際に作ってみよう #jgguggriffon plugin を 実際に作ってみよう #jggug
griffon plugin を 実際に作ってみよう #jggug
kimukou_26 Kimukou
 

Semelhante a Rdkitの紹介 (20)

次世代言語 Python による PyPy を使った次世代の処理系開発
次世代言語 Python による PyPy を使った次世代の処理系開発次世代言語 Python による PyPy を使った次世代の処理系開発
次世代言語 Python による PyPy を使った次世代の処理系開発
 
2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source
 
今最もアツイdistribution Gentoo Linuxについて
今最もアツイdistribution Gentoo Linuxについて今最もアツイdistribution Gentoo Linuxについて
今最もアツイdistribution Gentoo Linuxについて
 
High performance python computing for data science
High performance python computing for data scienceHigh performance python computing for data science
High performance python computing for data science
 
【Unite Tokyo 2019】運用中超大規模タイトルにおけるUnityアップデート課題の解決手法と事例
【Unite Tokyo 2019】運用中超大規模タイトルにおけるUnityアップデート課題の解決手法と事例【Unite Tokyo 2019】運用中超大規模タイトルにおけるUnityアップデート課題の解決手法と事例
【Unite Tokyo 2019】運用中超大規模タイトルにおけるUnityアップデート課題の解決手法と事例
 
PyQtではじめるGUIプログラミング
PyQtではじめるGUIプログラミングPyQtではじめるGUIプログラミング
PyQtではじめるGUIプログラミング
 
Windowsにpythonをインストールしてみよう
WindowsにpythonをインストールしてみようWindowsにpythonをインストールしてみよう
Windowsにpythonをインストールしてみよう
 
Infinite Debian - Platform for mass-producing system every second
Infinite Debian - Platform for mass-producing system every secondInfinite Debian - Platform for mass-producing system every second
Infinite Debian - Platform for mass-producing system every second
 
Runtime c++editing
Runtime c++editingRuntime c++editing
Runtime c++editing
 
Python3 プログラミング勉強会
Python3 プログラミング勉強会Python3 プログラミング勉強会
Python3 プログラミング勉強会
 
Introduction Pycon2010
Introduction Pycon2010Introduction Pycon2010
Introduction Pycon2010
 
OCaml でデータ分析
OCaml でデータ分析OCaml でデータ分析
OCaml でデータ分析
 
Pythonの環境導入 2014年春季版
Pythonの環境導入 2014年春季版Pythonの環境導入 2014年春季版
Pythonの環境導入 2014年春季版
 
Python & PyConJP 2014 Report
Python & PyConJP 2014 ReportPython & PyConJP 2014 Report
Python & PyConJP 2014 Report
 
vscode pipenv docker
vscode pipenv dockervscode pipenv docker
vscode pipenv docker
 
Deep Learningハンズオン勉強会「Caffeで画像分類を試してみようの会」
Deep Learningハンズオン勉強会「Caffeで画像分類を試してみようの会」Deep Learningハンズオン勉強会「Caffeで画像分類を試してみようの会」
Deep Learningハンズオン勉強会「Caffeで画像分類を試してみようの会」
 
ゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せます
 
GraalVMの多言語実行機能が凄そうだったので試しにApache Sparkに組み込んで動かしてみたけどちょっとまだ早かったかもしれない(Open So...
GraalVMの多言語実行機能が凄そうだったので試しにApache Sparkに組み込んで動かしてみたけどちょっとまだ早かったかもしれない(Open So...GraalVMの多言語実行機能が凄そうだったので試しにApache Sparkに組み込んで動かしてみたけどちょっとまだ早かったかもしれない(Open So...
GraalVMの多言語実行機能が凄そうだったので試しにApache Sparkに組み込んで動かしてみたけどちょっとまだ早かったかもしれない(Open So...
 
griffon plugin を 実際に作ってみよう #jggug
griffon plugin を 実際に作ってみよう #jgguggriffon plugin を 実際に作ってみよう #jggug
griffon plugin を 実際に作ってみよう #jggug
 
20120915 Pythonは本当にBlenderの役に立っているか?
20120915 Pythonは本当にBlenderの役に立っているか?20120915 Pythonは本当にBlenderの役に立っているか?
20120915 Pythonは本当にBlenderの役に立っているか?
 

Rdkitの紹介