Mais conteúdo relacionado Semelhante a バイオサイエンス分野における機械学習応用研究の最新動向 (20) Mais de ハイシンク創研 / Laboratory of Hi-Think Corporation (7) バイオサイエンス分野における機械学習応用研究の最新動向3. “機械は学術研究の夢をみるか”
Meet the new lab assistant | May 2,
2017 Issue - Vol. 95 Issue 19 |
Chemical & Engineering News
http://cen.acs.org/articles/95/i19/Meet-
your-new-lab-assistant.html
4. 本日の内容
機械学習
人気の理由
得意領域
“Bio is the new digital”
先進的な取り組み
機械学習応用事例の紹介
高精度測定器による大腸菌枯草菌判定
白血球分類
遺伝子情報解析
10. 機械学習:対象領域
予測予知
エネルギー消費予測、株式市場推移
関連性推定
NetFlix や Amazon 関連商品提示
異常検知
セキュリティ、偽造偽証、医療診断
分類判別
カード信用情報判別、がん細胞走査
ランク付け
Google 検索結果の順位決定、個人別最適化
記事要約
ニュースサイト、SNS ビックデータ分析
自律判断
AI, ロボット操作、高性能コンパイラ、株式売買
12. 機械学習:理解するために
理解するには
数学知識
行列演算(線形代数)・確率統計理論と実践
英語を読み解く力
実践するには
プログラミング知識と能力
Python, Julia, LUA, R, C++/C, CUDA, …
TensorFlow, Caffe, Chainer, Torch7, …
https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/lecture5.pdf
https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/lecture8.pdf
13. 画像認識とディープラーニング
U. of Toronto, Alex Krizhevsky, “ImageNet Classification with Deep
Convolutional Neural Networks,” 2012
画像認識コンテストで2位に大きく差をつけて優勝
New York U., Yann LeCun, “Gradient-Based Learning Applied to
Document Recognition,” 1998
手書き文字認識における成功事例の古典
NHK 放送技術研究所、福島邦彦、”Neocognitron: A Self-organizing
Neural Network Model for a Mechanism Pattern Recognition
Unaffected by Shift in Position,” 1980
多層パーセプトロンによる画像認識手法を提案
15. 機械学習:単語帳
CNN - Convolutional Neural Network
RNN - Recurrent Neural Network
SGD – Stochastic Gradient Decent
確率的勾配降下法
backward propagation
誤差逆伝播
probability density function
確率密度関数
MLE – Maximum Likelihood Estimation
最尤推定
… https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/lecture5.pdf
16. “Bio is the new digital”
MIT メディアラボ所長
伊藤穰一 Joi Ito
O’Reilly 2015 SOLID Conference
https://youtu.be/pnHD8gvccpI
https://conferences.oreilly.com/solid/internet-of-things-2015
17. Biology: Discovery → Design
観察分析の科学から設計構築の科学へ
薬品、食品、燃料、材料、医療、環境 …
Synthetic Biology
構成主義生命科学
設計し構成する学究
18. ディジタルサイエンスの興隆
Robotic Cloud Laboratory … “Biology on demand”
Emerald Cloud Lab
Transcriptic
Twist BioScience
OpenTrons
Connected Laboratory
TetraScience
Cloud Document processing
OverLeaf
Connected Science … science repository & community
FigShare
20. 事例2
機械学習による白血球の自動分類
米国 Athelas 社による機械学習実践の事例報告
“Classifying White Blood Cells With Deep Learning” 2017-3-29
創業者によるブログ
コードと画像データの GitHub 公開あり
LeNet モデルに基づく画像認識事例
Keras パッケージを使用
https://blog.athelas.com/classifying-white-blood-cells-with-convolutional-neural-
networks-2ca6da239331
https://github.com/dhruvp/wbc-
classification/blob/master/notebooks/binary_training.ipynb
21. 事例3
機械学習を用いた遺伝子解析
David Kelley, Department of Stem Cell and Regenerative Biology, Harvard
Univ.
“Basset: learning the regulatory code of the accessible genome with
deep convolutional neural networks”
学会誌 Genome Research 2016-5-3
http://genome.cshlp.org/content/26/7/990.full.pdf+html
モデル (ハンドクラフト ?)… 3x CNNブロック + 2x 全結合
Torch7 を使用
207 万データ
193 万データ=学習、7万データ=テスト、7 万データ=検証
遺伝子解析プログラム “Basset” として GitHub 公開
https://github.com/davek44/Basset