31. TESLA M40
ディープラーニングに向けた
最速アクセラレータ
0 1 2 3 4 5
GPU Server with
4x TESLA M40
Dual CPU Server
学習時間を13倍高速化
Number of Days
CUDA コア数 3072
ピーク単精度性能 7 TFLOPS
GDDR5 メモリ 12 GB/24 GB
メモリ帯域 288 GB/s
消費電力 250W
Reduce Training Time from 5 Days to less than 10 Hours
Note: Caffe benchmark with AlexNet, training 1.3M images with 90 epochs
CPU server uses 2x Xeon E5-2699v3 CPU, 128GB System Memory, Ubuntu 14.04
シングルGPUで
最高の単精度演算性能
32. 32
TESLA M4
最高のスループットを持つ
ハイパースケール
アクセラレータ
CUDA コア数 1024
ピーク単精度性能 2.2 TFLOPS
GDDR5 メモリ 4 GB
メモリ帯域 88 GB/s
形状 PCIe Low Profile
消費電力 50 – 75 W
Video
Processing
4x
Image
Processing
5x
Video
Transcode
2x
Machine
Learning
Inference
2x
H.264 & H.265, SD & HD
Stabilization and
Enhancements
Resize, Filter, Search,
Auto-Enhance
Preliminary specifications. Subject to change.
推論用途に最適
33. 33
TEGRA JETSON TX1
モジュール型スーパーコンピューター
主なスペック
GPU 1 TFLOP/s 256コア Maxwell
CPU 64ビット ARM A57 CPU
メモリ 4 GB LPDDR4 | 25.6 GB/s
ストレージ 16 GB eMMC
Wifi/BT 802.11 2x2 ac / BT Ready
ネットワーク 1 Gigabit Ethernet
サイズ 50mm x 87mm
インターフェース 400ピン ボード間接続コネクタ
消費電力 最大10W
Under 10 W for typical use cases
38. DRIVE PX AUTO-PILOT
CAR COMPUTER
NVIDIA GPU DEEP LEARNING
SUPERCOMPUTER
Trained
Neural Net Model
Classified Object
!
ONE-ARCHITECTURE ENABLES END-TO-END SOLUTION
Time-consuming Training on Server & Real-Time Recognition on Embedded System
Camera Inputs
47. DEEP LEARNING INSIGHT
従来のアルゴリズム ディープラーニング
0%
20%
40%
60%
80%
100%
overall passenger
channel
indoor public area sunny day rainny day winter summer
Pedestrian detection Recall rate
Traditional Deep learning
70
75
80
85
90
95
100
vehicle color brand model sun blade safe belt phone calling
Vehicle feature accuracy increased by Deep Learning
traditional algorithm deep learning
監視カメラ