Início
Conheça mais
Enviar pesquisa
Carregar
Entrar
Cadastre-se
Anúncio
Ohs#7 学習API
Denunciar
祐理 大野
Seguir
Fujitsu - System Engineer
26 de Dec de 2016
•
0 gostou
0 gostaram
×
Seja o primeiro a gostar disto
mostrar mais
•
848 visualizações
visualizações
×
Vistos totais
0
No Slideshare
0
De incorporações
0
Número de incorporações
0
Check these out next
build2017のazure関連情報まとめ
裕之 木下
Developer summit 2015 gcp
Google Cloud Platform - Japan
Azure DevOpsで技術同人誌作成
裕之 木下
Kubernetes & Google Container Engine; DockerコンテナをGKEでクラスタリングしてみた
祐磨 堀
Client Side Balzorでツールを作ってみた
裕之 木下
10分でわかる Cilium と XDP / BPF
Shuji Yamada
RancherとGitOps的な話
YASUKAZU NAGATOMI
クラウドで動画配信
裕之 木下
1
de
13
Top clipped slide
Ohs#7 学習API
26 de Dec de 2016
•
0 gostou
0 gostaram
×
Seja o primeiro a gostar disto
mostrar mais
•
848 visualizações
visualizações
×
Vistos totais
0
No Slideshare
0
De incorporações
0
Número de incorporações
0
Baixar agora
Baixar para ler offline
Denunciar
Engenharia
OHS#7 スライド
祐理 大野
Seguir
Fujitsu - System Engineer
Anúncio
Anúncio
Anúncio
Recomendados
ohs#6 opening
祐理 大野
421 visualizações
•
7 slides
Mesosで学習タスクの実行
祐理 大野
990 visualizações
•
17 slides
OHS#2 pythonでgreをつくってみる
祐理 大野
887 visualizações
•
15 slides
KubernetesでGPUクラスタを管理したい
Yuji Oshima
9K visualizações
•
28 slides
CloudSQL v2は デキる子なのか?
Kumano Ryo
9.6K visualizações
•
32 slides
Google Cloud AI の紹介 @ GCPUG Nara #03
Yaboo Oyabu
950 visualizações
•
53 slides
Mais conteúdo relacionado
Apresentações para você
(20)
build2017のazure関連情報まとめ
裕之 木下
•
89 visualizações
Developer summit 2015 gcp
Google Cloud Platform - Japan
•
5.3K visualizações
Azure DevOpsで技術同人誌作成
裕之 木下
•
879 visualizações
Kubernetes & Google Container Engine; DockerコンテナをGKEでクラスタリングしてみた
祐磨 堀
•
2.3K visualizações
Client Side Balzorでツールを作ってみた
裕之 木下
•
820 visualizações
10分でわかる Cilium と XDP / BPF
Shuji Yamada
•
10.9K visualizações
RancherとGitOps的な話
YASUKAZU NAGATOMI
•
1.5K visualizações
クラウドで動画配信
裕之 木下
•
1.1K visualizações
buddyのユーザ認証周りのデータ構造 - 使われているデータの取り回しについてのお話
Kazuhiro Hara
•
1.5K visualizações
6 月 18 日 Next - Kubernetes のコンテナ技術ですべてをシンプルに
Google Cloud Platform - Japan
•
2.9K visualizações
Katib
Yuji Oshima
•
3.1K visualizações
はじめよう Azure Functions
一希 大田
•
3.3K visualizações
SwaggerとAPIのデザイン
Kazuhiro Hara
•
3.7K visualizações
20170819 ocd-l tthon-pgdev
Toshi Harada
•
703 visualizações
Azureもくもく会@東京のいままでとこれからと
裕之 木下
•
606 visualizações
Try micronaut
賢太郎 前多
•
4.4K visualizações
Google bigquery導入記
Yugo Shimizu
•
2.7K visualizações
Google Cloud Platform は何がすごいのか?
Kiyoshi Fukuda
•
1.3K visualizações
「何もしないのにCIが失敗した」を防ぐ
Kazushi Kamegawa
•
1.3K visualizações
Infra: Kubernetes and GKE, Network
Kuma Arakawa
•
1.1K visualizações
Similar a Ohs#7 学習API
(20)
組み込みスクリプト言語Mrubyを利用したwebサーバの機能拡張支援機構
Ryosuke MATSUMOTO
•
2.1K visualizações
Db2 Warehouse Spark利用ガイド チュートリアル編
IBM Analytics Japan
•
252 visualizações
アプリケーションエンジニアのためのクラウドインフラ再入門 (2/3)
Takashi Sogabe
•
3.1K visualizações
試して学べるクラウド技術! OpenShift
Etsuji Nakai
•
6.4K visualizações
Ivsctonightandday2016winter moringsession awsreinvent2016recap
Tadashi Okazaki
•
625 visualizações
Case study puppet
Teruo Adachi
•
1.5K visualizações
2019年度 CaaS ワークショップ @ NTTコム
TomoyaTakegoshi
•
27.4K visualizações
AWS re:Invent2017で見た AWSの強さとは
NTT Communications Technology Development
•
1.3K visualizações
MLflowで学ぶMLOpsことはじめ
Kenichi Sonoda
•
799 visualizações
深層学習ネットワークのモバイル実装
Ryosuke Tanno
•
284 visualizações
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
DNA Data Bank of Japan center
•
1.3K visualizações
ゲームのインフラをAwsで実戦tips全て見せます
infinite_loop
•
6K visualizações
Windows PowerShell 2.0 の基礎知識
shigeya
•
4.1K visualizações
増加するコアを使い切れ!!
guestc06e54
•
1.7K visualizações
Let's start ISUCON
Toshiaki Endo
•
51 visualizações
PHP on Windows Azure in Open Source Conference
Microsoft
•
2.7K visualizações
「今そこにある危機」を捉える ~ pg_stat_statements revisited
Uptime Technologies LLC (JP)
•
5.6K visualizações
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜
Megagon Labs
•
16K visualizações
Mod mrubyについて
Ryosuke MATSUMOTO
•
10.2K visualizações
密着! nibohsiデプロイ 13:00-13:05 - railsアプリのデプロイ事例 -
Yukihiko SAWANOBORI
•
1.3K visualizações
Anúncio
Último
(20)
《天普大学毕业证|学位证书校内仿真版本》
d520dasw12
•
2 visualizações
揭秘新西兰留学:如何获得惠灵顿维多利亚大学毕业证?
hzdcyty
•
2 visualizações
#全套原版1:1精仿怀卡托大学学位证成绩单
b6f0190421d1rma
•
3 visualizações
★可查可存档〖制作卡尔顿大学文凭证书毕业证〗
mmmm282537
•
2 visualizações
《萨德伯里大学毕业证|学位证书校内仿真版本》
124hdjkhas
•
2 visualizações
★可查可存档〖制作魁北克大学文凭证书毕业证〗
mmmm282537
•
2 visualizações
★可查可存档〖制作巴黎第十二大大学文凭证书毕业证〗
tujjj
•
2 visualizações
★可查可存档〖制作波恩大学文凭证书毕业证〗
tujjj
•
8 visualizações
《高级时装学院毕业证|学位证书校内仿真版本》
hj123saf
•
2 visualizações
揭秘英国留学:如何获得利物浦大学毕业证?
yatenf
•
2 visualizações
揭秘美国留学:如何获得阿拉斯加大学毕业证?
xefexep
•
2 visualizações
Supliment5-Radio09(1995).pdf
ivan ion
•
3 visualizações
Radio02(1995).pdf
ivan ion
•
2 visualizações
《阳光海岸大学毕业证|学位证书校内仿真版本》
hj123saf
•
2 visualizações
W&B Seminar #4.pdf
Akira Shibata
•
15 visualizações
《戴尔豪斯大学毕业证|学位证书校内仿真版本》
124hdjkhas
•
3 visualizações
★可查可存档〖制作南安普顿大学文凭证书毕业证〗
vgfg1
•
2 visualizações
★可查可存档〖制作贝桑松大学文凭证书毕业证〗
tujjj
•
2 visualizações
mabl - 負荷テストにおけるmablのAPIテスト活用_20230525
Yuki Shimizu
•
19 visualizações
★可查可存档〖制作温尼伯大学文凭证书毕业证〗
mmmm282537
•
2 visualizações
Ohs#7 学習API
ohs#7 学習API 2016/12/19 @task_woof
学習API • REST APIによる学習の実施 •
2タイプのタスクを想定 • 「バッチタスク」: バッチ形式で学習を実施する場合 • 「サービスタスク」: - 対話環境(Jupyter Notebook)で小規模の学習 - 推論サービスのデプロイ バッチタスク (ユースケース) 大規模な学習, 複数人環境での学習の実施 サービスタスク (ユースケース) 実験的な学習や学習結果を用いた推論サービスのデプロイ タスク 定義
前回お話したこと 1. 環境がバリエーションが多い • CUDA,
cuDNN, DLフレームワークの組み合わせ分の環境を用意する → 様々環境を使ってみたいという要望に対応するため 2. GPUリソースの管理が必要 • ジョブ管理 • リソース管理 CUDA7.5 cuDNN4 Caffe CUDA8.0 cuDNN4 Caffe CUDA7.5 cuDNN5 Caffe CUDA8.0 cuDNN5 Caffe CUDA7.5 cuDNN4 Chainer CUDA8.0 cuDNN4 Chainer CUDA7.5 cuDNN5 Chainer ... 使われなさそうな環境も用意しておく必要がある 排他など多重実行を抑制する 高頻度!低頻度...
前回お話したこと • 分散コンピューティングのための基盤ソフトウェア • Mesosが提供するFrameworkをアプリ毎に用意することで、分散アプリ毎に マシンを用意しなくてよくなる •
v1.0.0よりGPUサポート (2016/7/27)
前回お話したこと Ref) http://mesos.apache.org/documentation/latest/architecture/ Marathon Chronos サービスタスク の投入 バッチタスク の投入 •
サービスタスクとしてMarathon、バッチタスクとしてChronosを利用する ことで学習APIを実現
前回お話したこと • DLフレームワークとJupyter Notebookを含むDockerイメージを用意 •
データ取得機能、ネットワーク定義、学習実行スクリプトは、ユーザの /homeに置いておく • Dockerコンテナを起動し、学習実行スクリプトを叩く Jupyter Notebook DLフレーム ワーク
前回お話したこと • いくつか課題がありました。 • Marathonはv1.3.0-RC1でGPU対応済み •
Dockerコンテナに対するGPUリソースの割当は未対応 • バッチタスクのFrameworkはChronosの後継が出たりと、まだデファ クトは現れていない
Apache Mesos タスク タイプ Framework 特徴
ライセンス Docker対応 GPU指定 対応 バッチ Chronos - Cronを設定可能 - Docker対応 Apache License v2 ○ × Metronome - Chronosの後継といわれてい る Apache License v2 ○ × Jenkins - Mesos-Pluginがある Apache License v2 ○ × JobServer - 無料版と商用版がある GramdLogic × × GoDocker - Docker上でバッチ/インタラクティ ブな実行可能 IRISA ○ △ Cook - Sparkもサポートしている バッチスケジューラ Apache License v2 △ ○ retz - ノーチラステクノロジーさん 製のバッチフレームワーク Apache License v2 ○ ○ サービス Apahce Aurora - Docker Swarmに統合予定 - Cronも可能 Apache License v2 ○ ○ Marathon - サービスに特化した Framework - 開発は活発 Apache License v2 ○ ○ Singularity - 開発は活発 - バッチも可能 Apache License v2 ○ × Ref) Apache Mesos Framework Entering Into The Docker World: A Hitch-Hikers Guide To Clustering • 下記のFrameworkは未評価。実現できるものもあるかも。
PBS Professional • PBS
Professionalについて • CAE分野で多くの実績(社内で利用しているエンジニアが多い) • 今年6月からOSS版がリリースされた • 実現性の確認 GPUの指定が可能か? 社内で事例あり Dockerを利用可能か? フックスクリプトでDockerコンテナの起動およびコンテナにジョブ投入、コンテナの削除を実行 /homeをコンテナにマウント 実行ユーザ権限でDockerコンテナを起動 Masterノード Agentノード PBS Server PBS MoM execjob_launch execjob_end 1. コンテナを起動 2. ジョブ実行 3. コンテナを削除 REST API 機能
PBS Professional • 通常ジョブはDockerコンテナではなく、計算ノードで実行できること •
qsubコマンドの引数で制御する Dockerイメー ジが指定され ているか GPUオプショ ンが指定され ているか GPUオプショ ンが指定され ているか ジョブ 投入 はい いいえ GPUを割り当てた Dockerコンテナで ジョブ実行 Dockerコンテナで ジョブ実行 GPUジョブの 実行 通常ジョブの 実行
PBS Professional • 現時点の妥協点... •
DockerコンテナへのGPUリソース割当はNvidia-Dockerを利用 • Nvidia-DockerはisolationするGPUの指定が必要 • ngpusではGPUをどのGPUを利用すべきか指針がない ⇒割り当てるGPUを明に指定させる • ユーザはどのようなGPUがあるかを取得 • どのGPUにジョブを投入するかを指定 $ nvidia-docker run -ti caffe /bin/bash # 全GPUをコンテナに見せる $ NV_GPU=‘0,1’ nvidia-docker run -ti caffe /bin/bash # GPU 0, 1のみDockerコンテナに見せる PBS MoM execjob_launch execjob_end 1-1. コンテナを起動 2. ジョブ実行 3. コンテナを削除 gpu_id: gpu0 1-2. GPUを割当
PBS Professional • Dockerコンテナがたまに起動しない •
“Remove In Progress”でDockerコンテナが起動後すぐに落ちる • 今のところ再現性を確認できていない • Docker Daemonを再起動する方法以外に回避できていない
これから • まずは「ドッグフーディング」として社内リリース • 改善、要望からサービスを強化していく •
やっぱりgpu数だけで指定したい → cgroup hook (NVIDIA docker使 用せず) • 学習状況を取得したい → フレームワーク毎に差異があり、統一できるか
Anúncio