SlideShare uma empresa Scribd logo
1 de 62
Baixar para ler offline
出張!DeNAデータサイエンス輪講
加納龍一
大規模並列実験を支える
クラウドサービスと基盤技術
2
▪ 加納龍一 (かのうりゅういち)
▪ DeNAに入社→Mobility Technologiesに出向
▪ 交通移動体データの解析や、それらを活用した機械学習システムの社会実装
▪ (昔話) 2年前から始まった社内DS勉強会の、ひとりめの発表者でした
▪ 張り切って準備した当時の発表資料:
https://www.slideshare.net/RyuichiKanoh/lightgbm-124545133
自己紹介
3
項目
01|実験効率化の重要性
02|並列実験に用いる基盤サービス
03|周辺ツール
04|まとめ
4
01 実験効率化の重要性
5
▪機械学習において、万能な手法は存在しない (No Free Lunch)
▪ 何をするにあたっても、試行錯誤は必要
▪Kaggle、実サービスの開発など、全て限られた時間の中での取り組み
試行錯誤の速度の重要性
ハイパーパラメータひとつで、
結果は大きく変わる
https://myrtle.ai/learn/how-to-train-your-resnet-5-hyperparameters/
6
▪ 何かを導入すると、適切なパラメータがずれる
▪ 決め打ちで評価しても、よくわからない
▪ 偶然に左右される
よくあるケース
parameter A parameter A
parameter B parameter B
従来手法 新規手法
この点のみで評価 この点のみで評価
7
[1] 手持ちのインスタンスで直列に実験
▪ pros: お手軽
▪ cons: 死ぬほど時間がかかる
[2] クラウドサービスを使用しインスタンスを大量に作成し並列化
▪ pros: 高速に実験ができる
▪ cons: 下手にやると、かえって手間が増える
アプローチ
ここをいかにスマートに行うかが、今日のテーマ
8
▪ 一度デプロイして終わりではない
▪ 季節変動
▪ 突発的イベント
▪ サービス地域拡大
▪ 大型施設が新規開店
▪ などなど、日々変化する状況に適応し続けていく必要がある
▪ モデル再デプロイごとに手動でパラメータを調整するのは大変
▪ 規模が大きくなってもスケールする形での探索が、社会実装には必須
大量の実験が必要になるケース (サービスの継続的展開)
9
▪ 単純にひとつの指標のみを最適化すれば良い場合は少ない
▪ よくあるのが、下図のようなケース
▪ いくつかのケースを提示して、トレードオフを決める
大量の実験が必要になるケース (事業部への複数の結果の提示)
指標A
指標B
指標の間にトレードオフがある
10
▪ 一年前、KaggleDaysというイベントでワークショップを担当
▪ https://kaggledays.com/events/tokyo2019/
▪ その際のテーマは、「ラベルノイズに対しての手法」
▪ 複数手法の効果をKaggleのデータを用いながら紹介するもの
▪ 大量のケーススタディを実施
大量の実験が必要になるケース (手法の検証)
11
▪ 当時の資料:https://www.slideshare.net/RyuichiKanoh/practical-tips-for-handling-noisy-data-and-annotaiton-204195412
大量の実験が必要になるケース (手法の検証)
96通り
16通り
50通り
12
▪ 複数モデルを用いたアンサンブル学習
▪ Cross-Validationにおいて、Foldごとに学習を分散
▪ 各手法の実験的探索(モデル構成、ハイパラ、前処理...)
大量の実験が必要になるケース (コンペティション)
https://developer.ibm.com/technologies/artificial-intelligence/articles/stack-machine-learning-models-get-better-results/
13
▪ Compute EngineなどでVMインスタンスを立てまくる
しかし、よく考えてみると...
▪ インスタンスの種類を変えるときには全部立て直す?
▪ 実行した後にインスタンスを自動で落とすスクリプトを仕込む?
▪ 環境構築、やればできるがいちいち面倒では?
一番最初に思いつく方法
管理コストが尋常じゃない
14
▪ GCPのクラウド環境を利用した、様々な機能の集合
▪ 訓練、予測API作成、パラメータ調整、分析環境構築...
▪ “AI Platform”と名前はついているが、機械学習以外でも活躍
便利なサービス:Google Cloud AI Platform
15
各種機能
AI Platform Training https://cloud.google.com/ai-platform/training/docs?hl=ja
Prediction https://cloud.google.com/ai-platform/prediction/docs?hl=ja
Optimizer https://cloud.google.com/ai-platform/optimizer/docs?hl=ja
Notebooks https://cloud.google.com/ai-platform/notebooks/docs?hl=ja
Pipelines https://cloud.google.com/ai-platform/pipelines/docs?hl=ja
Data Labeling Service https://cloud.google.com/ai-platform/data-labeling/docs?hl=ja
Deep Learning Containers https://cloud.google.com/ai-platform/deep-learning-containers/docs?hl=ja
Deep Learning VM Image https://cloud.google.com/ai-platform/deep-learning-vm/docs?hl=ja
16
各種機能 (今日の話)
AI Platform Training https://cloud.google.com/ai-platform/training/docs?hl=ja
Prediction https://cloud.google.com/ai-platform/prediction/docs?hl=ja
Optimizer https://cloud.google.com/ai-platform/optimizer/docs?hl=ja
Notebooks https://cloud.google.com/ai-platform/notebooks/docs?hl=ja
Pipelines https://cloud.google.com/ai-platform/pipelines/docs?hl=ja
Data Labeling Service https://cloud.google.com/ai-platform/data-labeling/docs?hl=ja
Deep Learning Containers https://cloud.google.com/ai-platform/deep-learning-containers/docs?hl=ja
Deep Learning VM Image https://cloud.google.com/ai-platform/deep-learning-vm/docs?hl=ja
17
02 並列実験に用いる基盤サービス
18
▪ 概観
AI Platform Training
Local Machine
AI Platform TrainingContainer Registry
push
pull
command:
・マシンタイプ
・Docker image
・実行引数
job execution (CLI or python function)
所定のマシンでコンテナを動かし、
終わったらマシンを自動で消す
CLIコマンド例
*カスタムコンテナを使うことが多いので、その場合を説明
19
▪ jobを複数投入すれば、複数同時に実行することが可能
▪ 大量のインスタンスを用いた実験が簡単に!
AI Platform Training
とある実験のスクリーンショット
30程度のインスタンスが同時に動作
ダッシュボードをクリックすれば、
ジョブごとのログや入出力なども確認できて便利
20
▪ AI Platform Trainingを用いて、大規模にパラメータ探索
AI Platform Optimizer
並列で実験を行い、
結果を最適化にフィードバック
parameter_search.py
(optunaなどを使ってもOK)
command:
・マシンタイプ
・Docker image
・実行引数 (ここを調整) AI Platform Training
feedback
pull
Container registry
multiple suggest
job execution
21
▪ 並列パラメータ探索実験結果の可視化 (wandbを使用)
AI Platform Optimizer
XGBoost
MLP
ばらつき ~ 0.008
ばらつき ~ 0.040
22
▪ 典型的なモデルについては、DockerImageが公開されている
▪ pathなどを引数で渡すことで、そのまま使用可能
▪ 最近、微分可能な決定木を基盤としたモデルが標準実装された
▪ 表形式データに対する手法として期待
▪ E2Eで様々なタスクに柔軟に対応
▪ 階層構造を持った解釈性を持つ
▪ モデルの定期的なfinetuneがしやすい
▪ など、嬉しい点は色々ありそう
▪ 参考:(https://www.slideshare.net/RyuichiKanoh/miru2020-tutorial-237272385)
Built-in algorithms in AI Platform Training
Input: x
Inner Node
filter: w
bias: b
Leaf
value: rl
Leaf
value: rr
1-σ(wx+b) σ(wx+b)
Output
[1-σ(wx+b)]*rl
+ [σ(wx+b)]*rr
23
(余談) 微分可能な決定木の可視化, epoch=0
*このモデルは自分で実装したものなので、built-in algorithmとは違います
24
(余談) 微分可能な決定木の可視化, epoch=1
*このモデルは自分で実装したものなので、built-in algorithmとは違います
25
(余談) 微分可能な決定木の可視化, epoch=2
*このモデルは自分で実装したものなので、built-in algorithmとは違います
26
(余談) 微分可能な決定木の可視化, epoch=10
*このモデルは自分で実装したものなので、built-in algorithmとは違います
27
(余談) 微分可能な決定木の可視化, epoch=30
*このモデルは自分で実装したものなので、built-in algorithmとは違います
28
(余談) 微分可能な決定木の可視化, epoch=60
*このモデルは自分で実装したものなので、built-in algorithmとは違います
29
(余談) 微分可能な決定木の可視化, epoch=90
*このモデルは自分で実装したものなので、built-in algorithmとは違います
30
▪ 並列で実験を回したい際には、AI Platform Trainingが便利
▪ GCP上で、任意のインスタンスを任意の数だけ立てて処理を実行できる
▪ VMを自分で複数立てるよりも、かなり管理コストが低い
▪ ハイパーパラメータ調整の枠組みとの親和性も高い
▪ 組込アルゴリズムも存在
▪ 自分で実装しにくいようなものについても、パッと試すことができる
中間まとめ[1]
31
▪ 個人的には、シンプルなタスクに対してであれば十分だと思う
▪ “学習して予測精度を評価するだけ”の場合などは特に便利
▪ しかし、凝ったことをしようと思うと、欲が出てくる
▪ 複数のコンテナ間で依存関係を保ちながら、よしなに動いてほしい
▪ 前処理、学習、評価、解析、シミュレーション...
▪ AI Platform Trainingのジョブ投入から起動までのラグ(~5min)が気になる
▪ 複数インスタンスを用いた分散学習がしたい
⇨Dockerで管理できる内容の外側に意識が広がる
AI Platform Trainingで十分か?
32
▪ Dockerコンテナの運用管理のためのオープンソースシステム
▪ Cluster, Node, Podという構成要素
▪ Cluster: インスタンスの集合
▪ Node: ひとつのインスタンス
▪ Pod: インスタンスで実行される処理単位
Kubernetes (k8s)
33
▪ できることの例
▪ ジョブを投入したら、PodをどのNodeで動かすか自動で割り当ててくれる
▪ AI Platform Trainingで顕著なjob投入後のラグは少ない
▪ 処理の状況に応じて、Nodeの数をオートスケールして増やす/減らす
▪ 使用量が少ないときにはコストはきちんと少なくなる
▪ 実験用途だけでなく、サービスのデプロイなどに使われることも多い
▪ リカバリなどが充実
▪ クラウドサービスとの連携は必ずしも必要ない
▪ ここには詳しく書ききれないほど多機能
Kubernetes (k8s)
34
▪ コンテナ間の依存関係を解決しながらパイプラインを動かす
▪ 並列で動かせる部分は並列で
▪ 実行に失敗したものについてはリトライ
▪ 可視化との連携
▪ メトリクス
▪ 実行関係
▪ メタデータ
実験観点で実現したいこと
35
▪ Kubernetes環境でパイプラインを構築し実行するツール
▪ DAGのコンポーネントがコンテナに対応
▪ 裏ではArgoが動いている
▪ DAGのデプロイが簡単
▪ Airflow(Composer)と比べると実験向き
Kubeflow Pipeline
36
Kubeflow Pipeline
組込の可視化機能に加えて、
実験結果分析用のjupyter notebook実行を
DAGの一部にしておくと
自由度の高い可視化がUI上で表示できて便利
37
▪ GCP managedなKubeflow Pipeline
▪ GKE(Google Kubernetes Engine)などを使用しながら、GCP内で完結
AI Platform Pipeline
https://cloud.google.com/ai-platform/pipelines/docs/introduction?hl=ja
38
▪ 実験基盤としての観点 (私見)
▪ 両者は排他ではないので、合わせて使うことも多い
▪ Kubeflow Pipelineの一部でAI Platform Trainingを使用するなど
AI Platform Trainingのみか、Kubeflow Pipelineまで使うか
pros cons
Kubernetes
・Kubeflowが相当便利
 ・1コンテナで収まらない複雑な処理にスケール
 ・pipeline以外にも色々と機能が充実
・ひとつのインスタンスで複数を処理できる
・必ずしもクラウドは不要 (自社サーバーとかでも)
・サービスをデプロイする際にそのまま横展開が可
・クラスタの構築が手間
 ・「少し強いマシンに変えようかな?」が面倒
・学習コストがかかる
 ・組織に使用を強いると、少し大変な場合も
AI Platform
Training
・準備が楽
 ・ジョブ投入時にマシンタイプを選べるなど
・管理コストが低い
・ひとつのインスタンスで複数処理はできない
・ジョブ投入から起動までにラグが5minほど存在
・preemptibleインスタンスは使用不可
39
タクシー配車アプリ「GO」におけるサービス活用例
https://go.mo-t.com/
2020年9月より統合
40
▪ タクシー乗務員へ向けた経路推薦サービス
▪ どこを通れば乗客を見つけやすいか、リアルタイムに推薦
▪ ざっくりとしたエリアでなく、道路単位での経路を推薦
お客様探索ナビ (https://dena.com/jp/press/004550)
41
お客様探索ナビ (https://dena.com/jp/press/004550)
一台一台の車両が、リアルタイムデータを
活用しながら乗客を探す
42
アルゴリズム概観
需要・供給予測
(典型的な教師あり学習)
行動コスト推定
(逆強化学習)
経路推薦
(強化学習)
・・・
MDP parameters
・経路推薦そのもの以外にも、大量のコンポーネントが存在
 ・ひとつひとつの要素がハイパーパラメータを持つ
・性能評価のために用いるシミュレータも、なかなか複雑
*詳細は割愛
43
▪ 一度デプロイして終わりではない
▪ 季節変動
▪ 突発的イベント
▪ サービス地域拡大
▪ 大型施設が新規開店
▪ などなど、日々変化する状況に適応し続けていく必要がある
▪ モデル再デプロイごとに手動でパラメータを調整するのは大変
▪ 規模が大きくなってもスケールする形での探索が、社会実装には必須
社会実装に向けた課題(再掲)
44
▪ Kubeflow Pipeline + Optuna
▪ 最近ブログも公開されました:Blog, Slide
▪ 複雑な構成をうまく管理しながらパラメータを探索し、収益向上に貢献
各種ツールの活用例
・パラメータ探索・経路シミュレーションによる評価
・MDP parameterの抽出
・各処理の実行関係整備、並列実行
シミュレーション結果
パラメータ推薦
45
▪ 複雑な構成をひとつの処理単位で回し切るのは厳しい
▪ 複数処理の連携を考えたい ⇨ Dockerの外側まで意識が広がる
▪ Kubeflow pipelineで、複数処理をつなげたパイプラインを構築
▪ Kubernetesの恩恵を受けながら、便利な機能をいくつも持つ
▪ AI Platform Pipelineを使うと、使用のハードルもある程度下がる
▪ Kubeflow Pipeline + Optunaを活用したサービス例を紹介
▪ 詳細はBlogに
中間まとめ[2]
GCP managed Kubeflow Pipeline
46
03 周辺ツール
47
▪ 処理基盤が整っても、それらを動かすのは人間
▪ ときには、そこが面倒くささの大部分を占めてしまうことも
▪ 大量の実行引数設定
▪ 結果の集計がカオス
▪ 複雑すぎるMakefile
▪ などなど
なぜ周辺ツールの話?
48
タスクランナー
▪ Invoke, Fabric (http://www.pyinvoke.org/)
▪ pythonでMakefileを定義できるようなツール
▪ fstringの使用など (shell scriptでもできるが、直感的)
▪ yamlを入力とすると、その内容が含まれたdictを自動的に持つ
*別ツールだが、python-fireも似た感じで便利
tasks.py
@taskデコレータをつけた関数がCLIから呼べる
49
▪ Hydra (https://github.com/facebookresearch/hydra)
▪ yamlと組み合わせて、argparseまわりをシンプルに書ける
▪ 実行ごとに自動でディレクトリを分けてくれる (好みが別れる)
実行引数まわりの整備
argparseは数が増えてくると視認性が悪い...
コードも長くなる
50
実行引数まわりの整備
▪ Hydra使用例
yamlに書かれている内容が(追加実装なしで)
実行引数を用いて上書きできるように
51
▪ Kubeflow Fairing
▪ 同じことを別のバックで実施する際、実装をできるだけ共通化
お作法の隠蔽
▪ waitしてから次の処理を実施すると、マージンが生じる
▪ 並列処理数を保ちながら連続的にジョブを投入したい際には、
GNU parallelを使うと便利 (https://www.gnu.org/software/parallel/)
▪ seq 1 1 10 | parallel --jobs 3 "sleep {}" みたいな感じで使える
52
複数ジョブの並列実行
6
5
4 2
3
4
wait
53
▪ 基本的には、重い処理を先に実行すると良いことが多い
複数ジョブの並列実行
10
8
9
7
6
5 4
3
2 1
10
8
9
7
6
5
4
3
2
1
54
結果の集約、可視化
▪ wandb, mlflow, comet-mlなどを活用し結果を集約
▪ kubeflow pipelineを使っている場合は、そこに集めてもよい
▪ 指標をBigQueryを使用して集計したり多くの人が結果を利用する
場合などは、BigQueryやGoogle Spread Sheetに直接飛ばすことも
▪ UIでの描画機能は、大規模実験においてはかなり重要だと思う
55
結果の集約、可視化
wandbを使用して描画したparallel coordinate plot
56
結果の集約、可視化
wandbに送った情報を、再度pythonで読み込む例
▪ metric以外も分析するので、柔軟な保存/再取得は重要
▪ 学習済みモデル、各種パラメータの学習曲線、特徴量重要度など
57
▪ papermill (https://github.com/nteract/papermill)
▪ 実行時引数を渡してnotebookの処理を切り替えることができる
結果の集約、可視化
https://qiita.com/MasafumiTsuyuki/items/7e8f7fd043243128450d
58
単純機能の共通化について
▪ 実行引数以外に必要な入力が存在しない機能が幾つかある
▪ Slack通知やBigQueryを用いたSQLクエリの発行など
▪ 使い回しの効くDockerImageをGCRにpushしておくと管理が楽に
▪ Kubeflow Pipelineなどで使用する場合、イメージを参照するだけ
▪ 毎回冗長な実装をする必要がなくなる
▪ このあたりのentrypointを実装する際にも、invokeなどは便利
59
▪ 簡素に使いやすい処理体系を実装することは重要
▪ 計算基盤が構築されたとしても、処理体系が複雑ならば手間は残る
▪ 便利と思うツールを紹介
▪ タスクランナー
▪ 実行引数の管理
▪ 可視化
▪ などなど
中間まとめ[3]
60
04 まとめ
61
▪ もろもろの効率化は重要
▪ 実験的な試行錯誤から逃れることは難しい
▪ 実験効率化のいくつかの例を紹介
▪ Google Cloud AI Platformの活用
▪ AI Platform Training, Optimizer, Pipeline...
▪ 各種周辺ツールの利用
▪ 煩わしい処理を減らすことに貪欲に
まとめ
62
EOF

Mais conteúdo relacionado

Mais procurados

15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学Ken'ichi Matsui
 
落合流先生流の論文要旨フォーマット
落合流先生流の論文要旨フォーマット落合流先生流の論文要旨フォーマット
落合流先生流の論文要旨フォーマット森 哲也
 
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object DetectionDeep Learning JP
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定Akira Masuda
 
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向Yusuke Uchida
 
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~nocchi_airport
 
Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出Yusaku Kawaguchi
 
強化学習の分散アーキテクチャ変遷
強化学習の分散アーキテクチャ変遷強化学習の分散アーキテクチャ変遷
強化学習の分散アーキテクチャ変遷Eiji Sekiya
 
時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)
時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)
時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)STAIR Lab, Chiba Institute of Technology
 
ベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づけるベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づけるitoyan110
 
Maximum Entropy IRL(最大エントロピー逆強化学習)とその発展系について
Maximum Entropy IRL(最大エントロピー逆強化学習)とその発展系についてMaximum Entropy IRL(最大エントロピー逆強化学習)とその発展系について
Maximum Entropy IRL(最大エントロピー逆強化学習)とその発展系についてYusuke Nakata
 
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展Deep Learning JP
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編Hiroshi Shimizu
 
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision TreeNIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision TreeTakami Sato
 
クラシックな機械学習の入門  8. クラスタリング
クラシックな機械学習の入門  8. クラスタリングクラシックな機械学習の入門  8. クラスタリング
クラシックな機械学習の入門  8. クラスタリングHiroshi Nakagawa
 
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)STAIR Lab, Chiba Institute of Technology
 
深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理Taiji Suzuki
 
実践多クラス分類 Kaggle Ottoから学んだこと
実践多クラス分類 Kaggle Ottoから学んだこと実践多クラス分類 Kaggle Ottoから学んだこと
実践多クラス分類 Kaggle Ottoから学んだことnishio
 
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会Shunichi Sekiguchi
 
多様な強化学習の概念と課題認識
多様な強化学習の概念と課題認識多様な強化学習の概念と課題認識
多様な強化学習の概念と課題認識佑 甲野
 

Mais procurados (20)

15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学
 
落合流先生流の論文要旨フォーマット
落合流先生流の論文要旨フォーマット落合流先生流の論文要旨フォーマット
落合流先生流の論文要旨フォーマット
 
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
 
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
 
Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出
 
強化学習の分散アーキテクチャ変遷
強化学習の分散アーキテクチャ変遷強化学習の分散アーキテクチャ変遷
強化学習の分散アーキテクチャ変遷
 
時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)
時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)
時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)
 
ベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づけるベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づける
 
Maximum Entropy IRL(最大エントロピー逆強化学習)とその発展系について
Maximum Entropy IRL(最大エントロピー逆強化学習)とその発展系についてMaximum Entropy IRL(最大エントロピー逆強化学習)とその発展系について
Maximum Entropy IRL(最大エントロピー逆強化学習)とその発展系について
 
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision TreeNIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
 
クラシックな機械学習の入門  8. クラスタリング
クラシックな機械学習の入門  8. クラスタリングクラシックな機械学習の入門  8. クラスタリング
クラシックな機械学習の入門  8. クラスタリング
 
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
 
深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理
 
実践多クラス分類 Kaggle Ottoから学んだこと
実践多クラス分類 Kaggle Ottoから学んだこと実践多クラス分類 Kaggle Ottoから学んだこと
実践多クラス分類 Kaggle Ottoから学んだこと
 
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
 
多様な強化学習の概念と課題認識
多様な強化学習の概念と課題認識多様な強化学習の概念と課題認識
多様な強化学習の概念と課題認識
 

Semelhante a 大規模並列実験を支えるクラウドサービスと基盤技術

【Interop Tokyo 2013】 どうする?どうなる?SDN/クラウド時代の運用管理 ~データセンター、クラウド提供事業者の立場から~
【Interop Tokyo 2013】 どうする?どうなる?SDN/クラウド時代の運用管理 ~データセンター、クラウド提供事業者の立場から~【Interop Tokyo 2013】 どうする?どうなる?SDN/クラウド時代の運用管理 ~データセンター、クラウド提供事業者の立場から~
【Interop Tokyo 2013】 どうする?どうなる?SDN/クラウド時代の運用管理 ~データセンター、クラウド提供事業者の立場から~Shuji Yamada
 
20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructurePreferred Networks
 
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...VirtualTech Japan Inc.
 
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...Nobuyuki Tamaoki
 
ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題Kenta Oono
 
ChainerでDeep Learningを試す為に必要なこと
ChainerでDeep Learningを試す為に必要なことChainerでDeep Learningを試す為に必要なこと
ChainerでDeep Learningを試す為に必要なことJiro Nishitoba
 
エンタープライズにおけるOpen flowユースケースを考える
エンタープライズにおけるOpen flowユースケースを考えるエンタープライズにおけるOpen flowユースケースを考える
エンタープライズにおけるOpen flowユースケースを考えるcloretsblack
 
Tableau Drive、企業に導入する新しい方法
Tableau Drive、企業に導入する新しい方法Tableau Drive、企業に導入する新しい方法
Tableau Drive、企業に導入する新しい方法Tableau Software
 
NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則
NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則
NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則aslead
 
コンテナは次世代サービスの主流になるか?
コンテナは次世代サービスの主流になるか?コンテナは次世代サービスの主流になるか?
コンテナは次世代サービスの主流になるか?SAKURA Internet Inc.
 
【2017年】ディープラーニングのフレームワーク比較
【2017年】ディープラーニングのフレームワーク比較【2017年】ディープラーニングのフレームワーク比較
【2017年】ディープラーニングのフレームワーク比較Ryota Suzuki
 
TensorFlowプログラミングと分類アルゴリズムの基礎
TensorFlowプログラミングと分類アルゴリズムの基礎TensorFlowプログラミングと分類アルゴリズムの基礎
TensorFlowプログラミングと分類アルゴリズムの基礎Etsuji Nakai
 
ChainerでDeep Learningを試すために必要なこと
ChainerでDeep Learningを試すために必要なことChainerでDeep Learningを試すために必要なこと
ChainerでDeep Learningを試すために必要なことRetrieva inc.
 
20121019 engineer startup_meeting
20121019 engineer startup_meeting20121019 engineer startup_meeting
20121019 engineer startup_meetingShuichi Wada
 
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜Preferred Networks
 
20120927 findjob4 dev_ops
20120927 findjob4 dev_ops20120927 findjob4 dev_ops
20120927 findjob4 dev_opsume3_
 
JAWS-UG三都物語_企業でのAWS導入のエントリーポイント
JAWS-UG三都物語_企業でのAWS導入のエントリーポイントJAWS-UG三都物語_企業でのAWS導入のエントリーポイント
JAWS-UG三都物語_企業でのAWS導入のエントリーポイントToshiyuki Konparu
 
Intalio japan special cloud workshop
Intalio japan special cloud workshopIntalio japan special cloud workshop
Intalio japan special cloud workshopDaisuke Sugai
 

Semelhante a 大規模並列実験を支えるクラウドサービスと基盤技術 (20)

【Interop Tokyo 2013】 どうする?どうなる?SDN/クラウド時代の運用管理 ~データセンター、クラウド提供事業者の立場から~
【Interop Tokyo 2013】 どうする?どうなる?SDN/クラウド時代の運用管理 ~データセンター、クラウド提供事業者の立場から~【Interop Tokyo 2013】 どうする?どうなる?SDN/クラウド時代の運用管理 ~データセンター、クラウド提供事業者の立場から~
【Interop Tokyo 2013】 どうする?どうなる?SDN/クラウド時代の運用管理 ~データセンター、クラウド提供事業者の立場から~
 
20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure
 
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
 
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
オープンクラウド基盤の価値と導入へ向けた考慮点 〜IaaSからPaaSまで - EMC様セミナー 「あなたのビジネスを高速化!DevOpsとアジャイル開発...
 
ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題
 
ChainerでDeep Learningを試す為に必要なこと
ChainerでDeep Learningを試す為に必要なことChainerでDeep Learningを試す為に必要なこと
ChainerでDeep Learningを試す為に必要なこと
 
エンタープライズにおけるOpen flowユースケースを考える
エンタープライズにおけるOpen flowユースケースを考えるエンタープライズにおけるOpen flowユースケースを考える
エンタープライズにおけるOpen flowユースケースを考える
 
Tableau Drive、企業に導入する新しい方法
Tableau Drive、企業に導入する新しい方法Tableau Drive、企業に導入する新しい方法
Tableau Drive、企業に導入する新しい方法
 
NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則
NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則
NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則
 
コンテナは次世代サービスの主流になるか?
コンテナは次世代サービスの主流になるか?コンテナは次世代サービスの主流になるか?
コンテナは次世代サービスの主流になるか?
 
【2017年】ディープラーニングのフレームワーク比較
【2017年】ディープラーニングのフレームワーク比較【2017年】ディープラーニングのフレームワーク比較
【2017年】ディープラーニングのフレームワーク比較
 
TensorFlowプログラミングと分類アルゴリズムの基礎
TensorFlowプログラミングと分類アルゴリズムの基礎TensorFlowプログラミングと分類アルゴリズムの基礎
TensorFlowプログラミングと分類アルゴリズムの基礎
 
ChainerでDeep Learningを試すために必要なこと
ChainerでDeep Learningを試すために必要なことChainerでDeep Learningを試すために必要なこと
ChainerでDeep Learningを試すために必要なこと
 
Nds#24 単体テスト
Nds#24 単体テストNds#24 単体テスト
Nds#24 単体テスト
 
20121019 engineer startup_meeting
20121019 engineer startup_meeting20121019 engineer startup_meeting
20121019 engineer startup_meeting
 
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
 
20120927 findjob4 dev_ops
20120927 findjob4 dev_ops20120927 findjob4 dev_ops
20120927 findjob4 dev_ops
 
JAWS-UG三都物語_企業でのAWS導入のエントリーポイント
JAWS-UG三都物語_企業でのAWS導入のエントリーポイントJAWS-UG三都物語_企業でのAWS導入のエントリーポイント
JAWS-UG三都物語_企業でのAWS導入のエントリーポイント
 
Intalio japan special cloud workshop
Intalio japan special cloud workshopIntalio japan special cloud workshop
Intalio japan special cloud workshop
 
第11回しゃちほこオラクル倶楽部
第11回しゃちほこオラクル倶楽部第11回しゃちほこオラクル倶楽部
第11回しゃちほこオラクル倶楽部
 

大規模並列実験を支えるクラウドサービスと基盤技術