Mais conteúdo relacionado
Semelhante a PCCC20 富士通株式会社「未来を引き寄せる力 スーパーコンピュータ」 (20)
Mais de PC Cluster Consortium (20)
PCCC20 富士通株式会社「未来を引き寄せる力 スーパーコンピュータ」
- 2. *Formerly known as Post-K
PRIMEHPC FX10
PRIMEHPC FX100
スーパーコンピュータ「京」から「富岳」へ
◼ スーパーコンピュータ「京」は 7年間の稼働ののち、 2019年8月に運用を停止
◼ スーパーコンピュータ「富岳」は2020年5月に出荷を完了し、
2021年度からの共用開始に向けてソフトウェアの整備中
◼ 富岳テクノロジPRIMEHPC FX1000, FX700の出荷、HPEへCPU A64FX供給を開始
© RIKEN
Copyright 2020 FUJITSU LIMITED
No.1(2017) No.1(2018)Finalist(2016)
Ranked Top500 No.1 in 2011
Competitive in various fields
スーパーコンピュータ「京」
PRIMEHPC
FX1000/FX700
© RIKEN© RIKEN
スーパーコンピュータ
「富岳」
1
- 3. システム仕様
「富岳」のスペックとベンチマーク達成性能
Copyright 2020 FUJITSU LIMITED
「京」, SPARC64 VIIIfx 「富岳」, A64FX
命令セット SPARC-V9 HPC-ACE Armv8.2-A SVE 512bit
倍精度演算ピーク性能 11.28 Petaflops 537 Petaflops
半精度演算ピーク性能 - 2.15 Exaflops (半精度)
総メモリバンド幅 5.64 PB/s 163 PB/s
インターコネクト Tofuインターコネクト TofuインターコネクトD
TOP500性能 (Petaflops) 10.51 (2011.6/2011.11: 1位) 415.53→ 442.01(2020.11: 1位)
HPCG性能 (Petaflops) 0.6027(2016.11~2017.11: 1位) 13.36→ 16.00 (2020.11: 1位)
HPL-AI性能 (Exaflops) ー 1.42→ 2.00 (2020.11:1位)
Graph500(TTEPS) 31.302(2014~2019.6: 1位) 70.98→ 102.95 (2020.11: 1位)
SC20
• TOP500(LINPACK ベンチマーク): スパコンの標準性能指標、理工学で一般的な線型方程式(密行列)を解く速度を測定
• HPCG : より実アプリ性能に近い評価を目指しているベンチマーク指標、反復法(CG法)で、疎行列の線型方程式を解く速度を評価
• HPL-AI:半精度(16ビットの浮動小数点)演算を活用して線型方程式を解く速度を評価(半精度演算はAI系で多用される演算)
• Graph500: ビッグデータ処理等の性能を評価する。整数演算、メモリアクセス速度などをグラフの探索速度で評価する
2
- 4. TOP500 「京」から「富岳」への1位の変遷
Copyright 2020 FUJITSU LIMITED
◼ 「富岳」と「京」比較すると。。。
◼ Linpack性能(Rmax)は約42倍に向上
◼ 消費電力は僅か約2.4倍の増加(「京」:12.66MW、「富岳」:29.90MW)
◼ 80%以上の演算効率を維持(TofuインターコネクトD, MPI, ジョブ管理, 高信頼ハード)
ノード数と実行効率
System # of nodes HPL eff Interconnect
Fugaku (富岳) 158,976 82.28% TofuD
Summit 4,356 74.01% Infiniband
SunwayTaihuLight 40,960 74.15% Custom
Tianhe-2 16,000 61.68% Custom(Fat tree)
Titan 18,688 64.88% Gemini
Sequoia 98,304 81.09% Custom(5D torus)
K computer (京) 88,128 93.17% Tofu
10,51PF, 12.66MW
442.01PF, 29.90MW
Rmax
PerformanceperKcomputer(logscale)
3
- 7. TOP500 1位の変遷と「富岳」の設計方針
Copyright 2020 FUJITSU LIMITED
#ofcores
PerformanceperKcomputer(logscale)
Rmax
GF/W
CPUコア数
アクセラレータコア数
◼ 「富岳」では、アプリケーション開発のしやすさと、適用領域の広さを目指し、
アクセラレータに頼らず、CPU性能を高める道を選択
アクセラレータ CPUのみ
GF/Wの改善 容易 難しい
アプリの開発 難しい 容易
アプリの適用領域 狭い 広い
「富岳」の選択
6
- 8. TOP500 1位の変遷と「富岳」の設計方針
◼ 4冠の達成
◼ TOP500 #1, HPCG #1, HPL-AI #1, Graph500 #1
Copyright 2020 FUJITSU LIMITED
HPCG number of Tianhe-2A is not published
アクセラレータ CPUのみ
GF/Wの改善 容易 難しい
アプリの開発 難しい 容易
アプリの適用領域 狭い 広い
「富岳」の選択
HPCG
アクセラレータコア
CPUコア
# of CPU cores
# of accelerator cores
#ofcores
PerformanceperKcomputer(logscale)
Rmax
GF/W
7
- 9. HPCGの性能と効率(@SC20)
Copyright 2020 FUJITSU LIMITED
◼ Symmetric Gauss-
Seidelループ分割最
適化*
◼ Tofu 6方向同時通信
による袖領域の通信
◼ Tofuのリダクション通信
のハードウェアサポート
Peak performance [Tflops][*] http://www.hpcg-benchmark.org/downloads/sc16/HPCG_on_the_K_Computer.pdf
Fractionofpeak(Efficiency)
HPCGperformance[Tflops]
Fugaku
Summit
Fugaku
Plasma Simulator
SX Aurora
◼ 「富岳」の演算効率は約 3% で他に比べ高い
8
- 11. [TOP500]スパコン性能トップ10(2020年11月)
Copyright 2020 FUJITSU LIMITED
◼ TOP500より (1993年よりスパコン性能上位500サイトのリストを6月と11月に公開) https://www.top500.org/
順位 システム名 設置サイト 国名 開発ベンダー プロセッサ アクセラレータ
性能
(PFlops)
1 Supercomputer Fugaku RIKEN Center for Computational Science Japan Fujitsu A64FX - 442.0
2 Summit DOE/SC/Oak Ridge National Laboratory United States IBM IBM POWER9 NVIDIA V100 148.6
3 Sierra DOE/NNSA/LLNL United States
IBM / NVIDIA /
Mellanox
IBM POWER9 NVIDIA V100 94.6
4 Sunway TaihuLight National Supercomputing Center in Wuxi China NRCPC Sunway SW26010 - 93.0
5 Selene NVIDIA Corporation United States NVIDIA AMD EPYC NVIDIA A100 63.5
6 Tianhe-2A National Super Computer Center in Guangzhou China NUDT Intel Xeon E5 Matrix-2000 61.4
7 JUWELS Booster Module Forschungszentrum Juelich Germany Atos AMD EPYC NVIDIA A100 44.1
8 HPC5 Eni S.p.A. Italy Dell Intel Xeon Gold NVIDIA V100 35.5
9 Frontera
Texas Advanced Computing Center/Univ. of
Texas
United States Dell
Intel Xeon
Platinum
- 23.5
10 Dammam-7 Saudi Aramco Saudi Arabia HPE Intel Xeon Gold NVIDIA V100 22.4
10
- 13. 国別スーパーコンピュータ性能(Rmax [TFlop/s])
United
States
Japan China Germany France Italy
Saudi
Arabia
United
Kingdom
Canada
Switzerla
nd
Rmax [TFlop/s] 668,704.3 593,700.1 565,318.6 133,945.8 89,828.3 78,529.0 35,997.0 34,067.5 26,698.1 26,215.4
0.0
100,000.0
200,000.0
300,000.0
400,000.0
500,000.0
600,000.0
700,000.0
800,000.0
性能(Rmax[TFlop/s])
Copyright 2020 FUJITSU LIMITED
594PF
565PF
データ出典:https://top500.org/
669PF
12
- 14. ベンダ別スーパーコンピュータ性能(Rmax [TFlop/s])
Fujitsu Lenovo IBM HPE
Cray/HP
E
Atos Inspur
IBM /
NVIDIA /
Mellanox
Dell EMC Nvidia
Rmax [TFlop/s] 525,854.9 356,727.5 206,397.1 195,618.6 161,491.3 161,191.3 129,755.3 112,840.0 100,435.7 95,159.0
0.0
100,000.0
200,000.0
300,000.0
400,000.0
500,000.0
600,000.0
性能(Rmax[TFlop/s])
Copyright 2020 FUJITSU LIMITED
357PF
206PF
データ出典:https://top500.org/
526PF
13
- 15. 「富岳」の技術的な新機軸と特長
◼ スマホやIoT機器で広く使われているArmアーキテクチャを採用したCPU「A64FX」を自社設計・開発
◼ OSはサーバ等で広く使われているRed Hat Enterprise Linux (RHEL 8)を採用
Copyright 2020 FUJITSU LIMITED
◼ Armのスパコン向け命令セットSVEを世界初実装、リードパートナーとしてArm社のSVE開発にも協力
• 京の4倍の処理能力を持つ演算器(512-bit SIMD)、AIで活用されている半精度演算(FP16)を実装
◼ 大量・高速に演算器にデータ供給できる積層メモリHBM2を汎用CPUでは世界で初めて採用
◼ 大規模での同時並列処理を可能とするTofuインタコネクトD採用(「京」のTofuをエンハンス)
◼ CPU/システム/ソフトウェアの一体開発による巨大システムの安定稼働、稼働率向上の実現
◼ 電力抑制機能のハードウェア実装とソフトウェアによる効率的な制御
◼ 富士通のCPU設計技術と最先端半導体を組合せ、世界トップクラスの優れた電力性能を実現
アプリケーションの高速化:最先端技術の採用
省電力性・高信頼性の実現:ハードウェア~ソフトウェアまで自社開発
使いやすさや広がり:業界標準の採用
14
- 18. 商用アプリケーションの拡大
◼ ISV各社と協同し、商用アプリのFX1000対応に取り組んでいます。
バイナリ―互換のFX700と富岳にも対応します。
提供予定 研究開発中
Copy right 2020 FUJITSU LIMITED
**スライド内の全てのアプリケーション名は、 各ベンダーの商標または登録商標です。製品は各ベンダーからの提供になります。LS-DY NA、scFLOW、Marcは、富士通からも提供可能です。
化学分野*
(2020年11月現在)
(by )
Ansys Fluent
(by )
scFLOW
VASP
Amber
(by Gaussian, Inc.)
Gaussian16
(by AlliedEngineeringCo.)
(by Convergent Science) (by ENGYS Ltd. & VINAS Co., Ltd.)
(by Siemens IndustrySoftwareInc.)
Simcenter STAR-CCM+
(by JSOL Corporation)
(by )
LS-DYNA
(by FujitsuLimited)
Poynting
(by ESI Group)
VPS (PAM-CRASH)
(by AltairEngineering, Inc.)
Altair Radioss™
(by )
Marc
エンジニアリング分野 (構造解析、流体解析、エレクトロニクス)
Chemistry*
20年4Qから
提供予定
20年10月
から提供
FX1000向け
に提供済み
*協力:オーストラリア国立大学
17
- 20. スーパーコンピュータが支える社会課題の解決
過去
将来
~ スーパーコンピュータ ~
【データ解析】
• AI(Deep Learning)
• ビッグデータ
:
シミュレーションとデータ解析の両輪で、スパコンは社会課題の解決やDXを支えるインフラとして利用が拡大
現在
【シミュレーション】
• 流体シミュレーション
• 衝突シミュレーション
• 材料シミュレーション
:
~ スパコンを活用したイノベーションが期待される分野例 ~
SDGsの
目標
具体的分野 ライフサイエンス 防災・環境ものづくりエネルギー
Copyright 2020 FUJITSU LIMITED19
- 22. グローバル展開の取り組み
◼ 製品の販売実績
◼ PRIMEHPC FXシリーズ
• GENCI(仏)
• レーゲンスブルク大学(独)
• サンディア国立研究所(米) 他
◼ HPE社による、A64FX搭載のスパコンHPE Apollo 80
• ライプニッツ・スーパーコンピュータ・センター(独)
• ブリストル大学(英)
• ロスアラモス国立研究所(米) 他
◼ 海外の先端研究機関との連携
◼ 共同研究開発の実施
• Barcelona Supercomputing Center(スペイン)
◼ 評価環境の提供
• Jülich Supercomputing Centre(独)、EPCC(英)、他
Copyright 2020 FUJITSU LIMITED
FX1000PRIMEHPC FX700
HPE Apollo80 System
A64FXのArm SVEを活かした
アプリ評価とエコシステム開発
21