More Related Content
Similar to エヌビディアのディープラーニング戦略 TESLA P100 & NVIDIA DGX-1 (20)
More from NVIDIA Japan (20)
エヌビディアのディープラーニング戦略 TESLA P100 & NVIDIA DGX-1
- 5. エヌビディア ディープラーニング プラットフォーム
コンピュータ ビジョン 会話と音 振る舞い
Object Detection Voice Recognition Translation
Recommendation
Engines
Sentiment Analysis
cuDNN cuBLAS cuSPARSE
NCCL
cuFFT
Mocha.jl
Image Classification
ディープラーニングSDK
フレームワーク
アプリケーション
GPU プラットフォーム
クラウド GPU
Tesla
P100
Tesla
K80/M40/M4
Jetson TX1
サーバー
DGX-1
GIE
DRIVEPX2
ディープラーニング 数学ライブラリ マルチ GPU 間通信
- 6. GPU コンピューティング 10年の歩み
2006 2008 2012 20162010 2014
Fermi: 世界初の
HPC 用 GPU
オークリッジ国立研究所の世界最速
GPUスーパーコンピュータ
世界初のHIVカプシドの
原子モデルシミュレーション
GPU AIシステムが碁の
世界チャンピオンを破る
スタンフォード大学がGPUを
利用したAIマシンを構築
世界初のヒトゲノムの
3次元マッピング
CUDA 発表
世界初の GPU
Top500 システム
Google がImageNetで
人間を超える
H1N1 の異変の
仕組みを解明
GPU を利用した
AlexNetが圧勝
- 7. 倍精度 5.3TF | 単精度 10.6TF | 半精度 21.2TF
TESLA P100
ハイパースケールデータセンターのための
世界で最も先進的な GPU
- 11. TESLA P100 アクセラレータ
Tesla P100
for NVLink-enabled Servers
Tesla P100
for PCIe-Based Servers
倍精度 5.3 TF
単精度 10.6 TF
半精度 21.2 TF
メモリ容量 16 GB
メモリバンド幅 720 GB/S
倍精度 4.7 TF
単精度 9.3 TF
半精度 18.7 TF
Config 1: メモリ容量 16 GB
メモリバンド幅 720 GB/S
Config 2: メモリ容量 12 GB
メモリバンド幅 540 GB/S
- 13. K40 K80 + cuDNN1
M40 + cuDNN4
P100 + cuDNN5
0x
10x
20x
30x
40x
50x
60x
70x
ディープラーニングの
イノベーションを
急速に加速
AlexNet training throughput based on 20 iterations,
CPU: 1x E5-2680v3 12 Core 2.5GHz. 128GB System Memory, Ubuntu 14.04
M40 bar: 8x M40 GPUs in a node
P100: 8x P100 NVLink-enabled
ディープラーニング トレーニング パフォーマンス
Caffe AlexNet
2013 2014 2015 2016
Speed-upofImages/SecvsK40in2013
- 17. 17
NVIDIA DGX-1 ソフトウェアスタック
ディープラーニング性能に最適化
NVIDIA DGX-1
NVIDIA cuDNN と NCCL
NVDocker
NVIDIA GPU ドライバ
GPU に最適化された Linux
クラウド マネジメント
• コンテナの作成と展開
• 複数ノードDGX-1クラスターの管理
• ジョブスケジューラー
• アプリケーションのリポジトリ
• システムのパフォーマンス監視
• ソフトウェアの更新機構
NVIDIA
DIGITS
GPU 最適化
ディープラーニング
フレームワーク