SlideShare uma empresa Scribd logo
1 de 38
Baixar para ler offline
Domain Specific Architecture は
今どこまで来ていて、これからどこに向かうか
Yutaka Yasuda, Kyoto Sangyo University
• 前半の CS-1 技術概説は以下の記事をご覧ください
“ウェハースケールCPUの誕⽣ - Cerebrasのクレイジーな挑戦”, 安⽥
豊, Gihyo.jp, 2020/1/31
https://gihyo.jp/news/interview/2020/01/3101
時代は DSA - Domain Specific Architecture である
Communications of the ACM,
February 2019, Vol. 62 No. 2
(as 2019 Turing Lecture)
WE BEGAN OUR TuringLectureJune4,201811
withareview
of computer architecture since the 1960s. In addition
to that review, here, we highlight current challenges
and identify future opportunities, projecting another
golden age for the field of computer architecture in
the next decade, much like the 1980s when we did the
A New Golden
Age for
Computer
Architecture
DOI:10.1145/3282307
Innovations like domain-specific hardware,
enhanced security, open instruction sets, and
agile chip development will lead the way.
BY JOHN L. HENNESSY AND DAVID A. PATTERSON
turing lecture
By John L. Hennessy,
David A. Patterson
The future of computing: a conversation with John Hennessy (Google I/O '18)
https://www.youtube.com/watch?v=Azt8Nc-mtKM
(いわゆる post Mooreʼs law のおはなしです)
これこれ
いや HPC って・・・
• 昔から Domain Specific だったけど?
そもそも⽬的が限られてて、それ⽤に設計してたよ
専⽤エンジン(Vector, etc)使ってたよ
そのための⾔語(拡張)も使ってたよ
もっと Specific な⽅向へ!
Cerebras CS-1
• Neural Network 学習専⽤
• Single CPU
WSE - Wafer Scale Engine
• 17U
Dec. 2019, at Cerebras
Single, but HUGE Processor
• WSE - Wafer Scale Engine
30cm Wafer まるごと
400,000 cores
⼆次元メッシュで PE 間接続
Dec. 2019, at Cerebras
“2019 Fourth Quarter Earnings Conference”, TSMC, Jan 16, 2020
16nmの安定感と現役度
• 12inchウェファー丸ごと
正⽅形に切り落とし
12 x 7 = 84 dies
• ダイ間接続
スクライブライン上に
メタル層(TSMC!)
• I/O は両サイドから
https://www.cerebras.net/wafer-scale-processors-the-time-has-come/
Processor Element
• 独⾃ Dataflow Arch.
• 40万PE
• 局所メモリで 18GB (SRAM)
• 2次元メッシュ接続
• アーキテクトは 3D Torus +
wormhole routing な インター
コネクト ASIC の開発経験あり
https://www.cerebras.net/cerebras-wafer-scale-engine-why-we-need-big-chips-for-deep-learning/
Placement
• NNのプレーンをまるごと収める
• 隣接プレーン間でデータを引き渡し
• 特定ノード間では多数ホップになる可能性あり
Dataflow = ⾮同期的通信
“通常のGPUベースのシステムでは学習時のコアの利⽤効
率は30%程度であるが、WSEのコア利⽤効率はその2倍
以上になるという”
⾼速ディープラーニングが可能なWSEをCerebrasはどうやって
実現したのか, Hisa Ando, 2020/1/8, マイナビニュース
https://news.mynavi.jp/article/20200108-951345/
• 通信⽤バッファメモリ 1GB+
https://www.cerebras.net/ispd-2020-contest/
Defect 対応
• Defects
1.5%の余剰コア
余剰配線で迂回
ハードウェアとして実装
• 電源ショートのコアが⼀つあっても
40万のリークからすれば・・・
• TSMCからはノーテストで受け⼊れ
https://www.cerebras.net/wafer-scale-processors-the-time-has-come/
Power and Cooling
• 15KW power / 84 chips
200W 以下ではある
17Uサイズあるから・・・
• とは⾔え20cm四⽅に集中!
• 正⾯から⼤量ピンで電⼒供給
• 背⾯で⽔冷
https://www.cerebras.net/wafer-scale-processors-the-time-has-come/
https://secureservercdn.net/198.12.145.239/a7b.fcb.myftpupload.com/wp-content/uploads/2019/11/Cerebras_for_SC19.pdf
トランシーバ
Software Side
• Tensorflow, PyTorch など既存の学習フレームワークに対応
• 200名を超えたがほぼソフトウェア技術者
• 今後最適化などで更に性能が上がると想像
Subject Changes to ….
RISC-V : オープンな ISA(命令セットアーキテクチャ)
• Berkeley の研究から
• オープン・利⽤無料の ISA (32bit, 64bit, 128bit)
• チップやソフトウェアを誰もが⾃由に設計・製作・販売可能
RISC-V コアを Chisel で書いたり RTL の形で GitHub へ GO! など
• SiFive, Andes, Western Digital など実装(商⽤)多数あり
• JASA(組み込みシステム技術協会)に RISC-V WG 発⾜
標準組込みプラットフォームへ:SHコンサルティングの河崎さんら
128bit は事実上予約のみ状態の慎重さ
=誤った予測で将来の負債を作らない
2018, 2019 の RISC-V Summit, US での状況報告など
• “中国は現在、数百種類のRISC-V SoCや数⼗種類のコアの開発を進めている
ようだ”
• デンソー⼦会社のIPベンダNSITEXEがSmartDVのTileLink向け検証IPを採⽤
• 地政学的リスクが却って押している?
Samsung が 5G モデムと AI エッジ(画像処理)側に RISC-V を採⽤
Alibaba 傘下企業から 64bit core (Xuantie 910, 16cores, 2.5(!)GHz)
RISC-V Foundation ⾃体も本部をスイスに移す計画
http://eetimes.jp/ee/articles/1812/10/news066.html から抜粋
https://www.eda-express.com/2019/12/risc-v-summit-2019risc-v.html など参照
⾝近なシリコン
• M5StickV
K210 (64bit dual core, FPU, NN engine, 400MHz, TSMC
28nm)
+ LCD, Camera, Gyro などなど付いて 3000円で⼤⼈気
• HiFive Unleashed board - $999 with 8GB DDR4, 1GbE
SiFive FU540 chip - TSMC 28nm, 64bit Quad core,
1.5GHz+, MMU有で Linux 動作
Open Source RTL - https://github.com/sifive/freedom
source: SiFive presentation
at RISC-V Workshop
in Barselona, 2018 May
https://content.riscv.org/wp-content/uploads/2018/05/09.25-09.55-tate-of-RISC-V-Software-RISC-V-Workshop-at-Barcelona-May-2018-1.pdf
ハイエンド・コア:⼩規模システムだけでない
• SiFive (⽶国)
U8 Core IP : 64bit, 3命令 Superscalar / Out-of-Order, マルチコア対応, MMU あり
なお SiFive はコアだけで無く関連技術も多数開発
• HBM2E+ : 7nm 検証済, 400Gbps (or ピンあたり3.2Gbps)
• Shield : RISC-V の TEE (Trusted Execution Environment) 実装, Arm TrustZone 相当
(AIST(産業技術総合研究所)の須崎さんらも⼿掛けている)
• Andes (台湾)
NX27V : 64bit, 1.1GHz, Vector Processor Unit あり
• Alibaba
Xuantie 910 : 64bit, 16cores, Out of Order, 2.5(!)GHz, “for AI and 5G” << お決まり
拡張命令セットのアイディア
• ベース ISA は超シンプル
整数レジスタ32本(0番はゼロ固定)
load, store, and/or/xor, add, sub, compare, branch, jump, nop 程度
• 多くの「拡張命令(オプション)」
Standard Extension:⼀般的で互いに衝突しないように設計
→ 整数の乗除命令・アトミック命令・単・倍精度の浮動⼩数点命令すら拡張で
Non-Standard Extension:特化+他 Extension との衝突を許容
Embedded向け16本のRV32Eもある
(Standard Extension との conflict も許容)
DSA のためです!
Domain
Specific
Architecture
Non-Standard Extension は何のため?
デザイン⾃由度は⾼い、と。
でも作るのって⼤変じゃん?
“WebでCore設計”
https://www.sifive.com/
https://www.sifive.com/
https://www.sifive.com/
ふむふむ ここまでもわかる これはなかなか
https://www.sifive.com/
シリコンまで!!
https://www.sifive.com/
公開画⾯イメージです (Coming Soon!)
https://www.sifive.com/
ここはまあわかる これはなかなか これすごくない?
量産まで前払い不要
https://www.sifive.com/
EDAツール提供
⽯だけ出来てもなあ・・・
拡張命令作れてもソフト対応がなあ・・・
Codasip Studio - ハード開発とソフト開発の連携
• CodAL : C/C++ ライクな⾔語で記述
命令セット定義と、マイクロアーキテクチャ定義
の 2 レベルで書く
この時、パイプラインの構造なども書ける
• 命令セットを定義すると
コアを⾃動合成して RTL で吐き
SDK (Compiler, Debugger, etc.) もできる
• オレオレ拡張命令を作って即デバッグ・テスト可能
• 標準RISC-Vコア(インオーダー)は提供される
アウトオブオーダーなども書ける(だろう)
顧客のために書く仕事もする(⾮オープンでやる)
http://riscv-association.jp/wp-content/uploads/2019/10/Codasip-RISC-V-Day-Japan-2019.pdf
まあ、いまどきのハードウェア開発はとてもソフトです
いまどきの Domain Specific Hardware
• Massive Parallel Processing : ノイマン型の苦⼿分野
• 迅速な Software 対応
既存の互換レイヤーへの対応でひとまずはOK
CS-1 : TensorFlow, PyTorch
RISC-V : Open Source のパワーを最⼤限利⽤
• Ajail Hardware Development
RISC-V : 振り向けくと増えてる
CS-1 : Brain Storming から 4.5 年
「むかし、ハードウェア開発は Waterfall だった」 と⾔われる (?)

Mais conteúdo relacionado

Mais procurados

Mais procurados (12)

NVIDIA Jetson Edge Computing Digital Seminar Special Edition, JETSON XAVIER NX
NVIDIA Jetson Edge Computing Digital Seminar Special Edition, JETSON XAVIER NXNVIDIA Jetson Edge Computing Digital Seminar Special Edition, JETSON XAVIER NX
NVIDIA Jetson Edge Computing Digital Seminar Special Edition, JETSON XAVIER NX
 
2017-12-04 BitVisor Summit 6 「BitVisorの現状と今後」
2017-12-04 BitVisor Summit 6 「BitVisorの現状と今後」2017-12-04 BitVisor Summit 6 「BitVisorの現状と今後」
2017-12-04 BitVisor Summit 6 「BitVisorの現状と今後」
 
Jetson XAVIER NX開発者キット Tips
Jetson XAVIER NX開発者キット TipsJetson XAVIER NX開発者キット Tips
Jetson XAVIER NX開発者キット Tips
 
札幌Ibmクラウド勉強会 blockchain
札幌Ibmクラウド勉強会 blockchain 札幌Ibmクラウド勉強会 blockchain
札幌Ibmクラウド勉強会 blockchain
 
OpenID BizDay #9 - 松尾真一郎氏 プレゼン資料
OpenID BizDay #9 - 松尾真一郎氏 プレゼン資料OpenID BizDay #9 - 松尾真一郎氏 プレゼン資料
OpenID BizDay #9 - 松尾真一郎氏 プレゼン資料
 
mraa Introduction
mraa Introductionmraa Introduction
mraa Introduction
 
Riscv+fpga200606
Riscv+fpga200606Riscv+fpga200606
Riscv+fpga200606
 
Hyperledgerプロジェクト概観
Hyperledgerプロジェクト概観Hyperledgerプロジェクト概観
Hyperledgerプロジェクト概観
 
『アプリケーション アーキテクチャ ガイド2.0』のガイド
『アプリケーション アーキテクチャ ガイド2.0』のガイド『アプリケーション アーキテクチャ ガイド2.0』のガイド
『アプリケーション アーキテクチャ ガイド2.0』のガイド
 
Blockchain EXE #1ブロックチェーン技術の可能性について解説|IBMコンサルティング・アーキテクト 平山毅
Blockchain EXE #1ブロックチェーン技術の可能性について解説|IBMコンサルティング・アーキテクト 平山毅Blockchain EXE #1ブロックチェーン技術の可能性について解説|IBMコンサルティング・アーキテクト 平山毅
Blockchain EXE #1ブロックチェーン技術の可能性について解説|IBMコンサルティング・アーキテクト 平山毅
 
データベース屋がHyperledger Fabricを検証してみた
データベース屋がHyperledger Fabricを検証してみたデータベース屋がHyperledger Fabricを検証してみた
データベース屋がHyperledger Fabricを検証してみた
 
Ac ri lt_fixstars_20210720
Ac ri lt_fixstars_20210720Ac ri lt_fixstars_20210720
Ac ri lt_fixstars_20210720
 

Semelhante a Domain Specific Architecture は今どこまで来ていて、これからどこに向かうか

DeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるか
DeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるかDeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるか
DeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるか
bitbank, Inc. Tokyo, Japan
 

Semelhante a Domain Specific Architecture は今どこまで来ていて、これからどこに向かうか (20)

RISC-Vのセキュリティ技術(TEE, Root of Trust, Remote Attestation)
RISC-Vのセキュリティ技術(TEE, Root of Trust, Remote Attestation)RISC-Vのセキュリティ技術(TEE, Root of Trust, Remote Attestation)
RISC-Vのセキュリティ技術(TEE, Root of Trust, Remote Attestation)
 
DeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるか
DeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるかDeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるか
DeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるか
 
要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議
 
サバフェス2016まとめLT
サバフェス2016まとめLTサバフェス2016まとめLT
サバフェス2016まとめLT
 
オープンイノベーション時代の工学スキル:国際標準化エンジニアリング
オープンイノベーション時代の工学スキル:国際標準化エンジニアリングオープンイノベーション時代の工学スキル:国際標準化エンジニアリング
オープンイノベーション時代の工学スキル:国際標準化エンジニアリング
 
VCK5000_Webiner_GIGABYTE様ご講演資料
VCK5000_Webiner_GIGABYTE様ご講演資料VCK5000_Webiner_GIGABYTE様ご講演資料
VCK5000_Webiner_GIGABYTE様ご講演資料
 
ストリーム処理勉強会 大規模mqttを支える技術
ストリーム処理勉強会 大規模mqttを支える技術ストリーム処理勉強会 大規模mqttを支える技術
ストリーム処理勉強会 大規模mqttを支える技術
 
Unno Wataru Nutanix Advent Calendar 2018
Unno Wataru Nutanix Advent Calendar 2018Unno Wataru Nutanix Advent Calendar 2018
Unno Wataru Nutanix Advent Calendar 2018
 
JDD Study #5 ブロックチェーンとILP 楠発表
JDD Study #5 ブロックチェーンとILP 楠発表JDD Study #5 ブロックチェーンとILP 楠発表
JDD Study #5 ブロックチェーンとILP 楠発表
 
映像解析IoTプラットフォーム SCORERの紹介
映像解析IoTプラットフォーム SCORERの紹介映像解析IoTプラットフォーム SCORERの紹介
映像解析IoTプラットフォーム SCORERの紹介
 
CISOが、適切にセキュリティ機能とレベルを決めるには ― 現状維持か変革かを分けるポイント
CISOが、適切にセキュリティ機能とレベルを決めるには― 現状維持か変革かを分けるポイントCISOが、適切にセキュリティ機能とレベルを決めるには― 現状維持か変革かを分けるポイント
CISOが、適切にセキュリティ機能とレベルを決めるには ― 現状維持か変革かを分けるポイント
 
Low-Codeプログラミングシステム Node-REDとその応用
Low-CodeプログラミングシステムNode-REDとその応用Low-CodeプログラミングシステムNode-REDとその応用
Low-Codeプログラミングシステム Node-REDとその応用
 
LoRaWANとAzure IoT Hub接続ハンズオン
LoRaWANとAzure IoT Hub接続ハンズオンLoRaWANとAzure IoT Hub接続ハンズオン
LoRaWANとAzure IoT Hub接続ハンズオン
 
hbstudy#88 5G+MEC時代のシステム設計
hbstudy#88 5G+MEC時代のシステム設計hbstudy#88 5G+MEC時代のシステム設計
hbstudy#88 5G+MEC時代のシステム設計
 
脆弱性スキャナVulsのAWS環境への融合
脆弱性スキャナVulsのAWS環境への融合脆弱性スキャナVulsのAWS環境への融合
脆弱性スキャナVulsのAWS環境への融合
 
ソフトウェアテストの最新動向の学び方
ソフトウェアテストの最新動向の学び方ソフトウェアテストの最新動向の学び方
ソフトウェアテストの最新動向の学び方
 
スマートファクトリーを支えるIoTインフラをつくった話
スマートファクトリーを支えるIoTインフラをつくった話スマートファクトリーを支えるIoTインフラをつくった話
スマートファクトリーを支えるIoTインフラをつくった話
 
日立ソリューションズの取り組みとプラットフォーム関連セション内容のご紹介
日立ソリューションズの取り組みとプラットフォーム関連セション内容のご紹介日立ソリューションズの取り組みとプラットフォーム関連セション内容のご紹介
日立ソリューションズの取り組みとプラットフォーム関連セション内容のご紹介
 
Android 10 dec, 2012
Android 10 dec, 2012Android 10 dec, 2012
Android 10 dec, 2012
 
コードを書かずにLチカ。から始めよう
コードを書かずにLチカ。から始めようコードを書かずにLチカ。から始めよう
コードを書かずにLチカ。から始めよう
 

Mais de Yutaka Yasuda

Mais de Yutaka Yasuda (12)

課題提出日の傾向から見る締切の期間設定
課題提出日の傾向から見る締切の期間設定課題提出日の傾向から見る締切の期間設定
課題提出日の傾向から見る締切の期間設定
 
ジェンガブロックの押しにくさを推定する試み
ジェンガブロックの押しにくさを推定する試みジェンガブロックの押しにくさを推定する試み
ジェンガブロックの押しにくさを推定する試み
 
力のある情報系学生をうまく採用して欲しいのです
力のある情報系学生をうまく採用して欲しいのです力のある情報系学生をうまく採用して欲しいのです
力のある情報系学生をうまく採用して欲しいのです
 
Segue, Landscape, Touch events, Alpha and User Defined Runtime Attributes
Segue, Landscape, Touch events, Alpha and User Defined Runtime AttributesSegue, Landscape, Touch events, Alpha and User Defined Runtime Attributes
Segue, Landscape, Touch events, Alpha and User Defined Runtime Attributes
 
教育側から見たセキュリティ人材教育の「明日はどっちだ」
教育側から見たセキュリティ人材教育の「明日はどっちだ」教育側から見たセキュリティ人材教育の「明日はどっちだ」
教育側から見たセキュリティ人材教育の「明日はどっちだ」
 
セキュリティ人材育成 最初の一步
セキュリティ人材育成 最初の一步セキュリティ人材育成 最初の一步
セキュリティ人材育成 最初の一步
 
京都産業大学におけるセキュリティ人材育成の考え方
京都産業大学におけるセキュリティ人材育成の考え方京都産業大学におけるセキュリティ人材育成の考え方
京都産業大学におけるセキュリティ人材育成の考え方
 
Lake Crest について調べてみた
Lake Crest について調べてみたLake Crest について調べてみた
Lake Crest について調べてみた
 
FPGA based 10G Performance Tester for HW OpenFlow Switch
FPGA based 10G Performance Tester for HW OpenFlow SwitchFPGA based 10G Performance Tester for HW OpenFlow Switch
FPGA based 10G Performance Tester for HW OpenFlow Switch
 
京都産業大学AO入試「情報」試験 – 実施報告と今後の展望
京都産業大学AO入試「情報」試験 – 実施報告と今後の展望京都産業大学AO入試「情報」試験 – 実施報告と今後の展望
京都産業大学AO入試「情報」試験 – 実施報告と今後の展望
 
A proposal of the OpenFlow controller development support tool
A proposal of the OpenFlow controller development support tool A proposal of the OpenFlow controller development support tool
A proposal of the OpenFlow controller development support tool
 
OpenFlowコントローラ開発支援ツールの提案
OpenFlowコントローラ開発支援ツールの提案OpenFlowコントローラ開発支援ツールの提案
OpenFlowコントローラ開発支援ツールの提案
 

Domain Specific Architecture は今どこまで来ていて、これからどこに向かうか

  • 1. Domain Specific Architecture は 今どこまで来ていて、これからどこに向かうか Yutaka Yasuda, Kyoto Sangyo University
  • 2. • 前半の CS-1 技術概説は以下の記事をご覧ください “ウェハースケールCPUの誕⽣ - Cerebrasのクレイジーな挑戦”, 安⽥ 豊, Gihyo.jp, 2020/1/31 https://gihyo.jp/news/interview/2020/01/3101
  • 3. 時代は DSA - Domain Specific Architecture である
  • 4. Communications of the ACM, February 2019, Vol. 62 No. 2 (as 2019 Turing Lecture) WE BEGAN OUR TuringLectureJune4,201811 withareview of computer architecture since the 1960s. In addition to that review, here, we highlight current challenges and identify future opportunities, projecting another golden age for the field of computer architecture in the next decade, much like the 1980s when we did the A New Golden Age for Computer Architecture DOI:10.1145/3282307 Innovations like domain-specific hardware, enhanced security, open instruction sets, and agile chip development will lead the way. BY JOHN L. HENNESSY AND DAVID A. PATTERSON turing lecture By John L. Hennessy, David A. Patterson
  • 5. The future of computing: a conversation with John Hennessy (Google I/O '18) https://www.youtube.com/watch?v=Azt8Nc-mtKM
  • 6. (いわゆる post Mooreʼs law のおはなしです)
  • 8. いや HPC って・・・ • 昔から Domain Specific だったけど? そもそも⽬的が限られてて、それ⽤に設計してたよ 専⽤エンジン(Vector, etc)使ってたよ そのための⾔語(拡張)も使ってたよ もっと Specific な⽅向へ!
  • 9. Cerebras CS-1 • Neural Network 学習専⽤ • Single CPU WSE - Wafer Scale Engine • 17U Dec. 2019, at Cerebras
  • 10. Single, but HUGE Processor • WSE - Wafer Scale Engine 30cm Wafer まるごと 400,000 cores ⼆次元メッシュで PE 間接続 Dec. 2019, at Cerebras
  • 11. “2019 Fourth Quarter Earnings Conference”, TSMC, Jan 16, 2020 16nmの安定感と現役度
  • 12. • 12inchウェファー丸ごと 正⽅形に切り落とし 12 x 7 = 84 dies • ダイ間接続 スクライブライン上に メタル層(TSMC!) • I/O は両サイドから https://www.cerebras.net/wafer-scale-processors-the-time-has-come/
  • 13. Processor Element • 独⾃ Dataflow Arch. • 40万PE • 局所メモリで 18GB (SRAM) • 2次元メッシュ接続 • アーキテクトは 3D Torus + wormhole routing な インター コネクト ASIC の開発経験あり https://www.cerebras.net/cerebras-wafer-scale-engine-why-we-need-big-chips-for-deep-learning/
  • 14. Placement • NNのプレーンをまるごと収める • 隣接プレーン間でデータを引き渡し • 特定ノード間では多数ホップになる可能性あり Dataflow = ⾮同期的通信 “通常のGPUベースのシステムでは学習時のコアの利⽤効 率は30%程度であるが、WSEのコア利⽤効率はその2倍 以上になるという” ⾼速ディープラーニングが可能なWSEをCerebrasはどうやって 実現したのか, Hisa Ando, 2020/1/8, マイナビニュース https://news.mynavi.jp/article/20200108-951345/ • 通信⽤バッファメモリ 1GB+ https://www.cerebras.net/ispd-2020-contest/
  • 15. Defect 対応 • Defects 1.5%の余剰コア 余剰配線で迂回 ハードウェアとして実装 • 電源ショートのコアが⼀つあっても 40万のリークからすれば・・・ • TSMCからはノーテストで受け⼊れ https://www.cerebras.net/wafer-scale-processors-the-time-has-come/
  • 16. Power and Cooling • 15KW power / 84 chips 200W 以下ではある 17Uサイズあるから・・・ • とは⾔え20cm四⽅に集中! • 正⾯から⼤量ピンで電⼒供給 • 背⾯で⽔冷 https://www.cerebras.net/wafer-scale-processors-the-time-has-come/
  • 18. Software Side • Tensorflow, PyTorch など既存の学習フレームワークに対応 • 200名を超えたがほぼソフトウェア技術者 • 今後最適化などで更に性能が上がると想像
  • 20. RISC-V : オープンな ISA(命令セットアーキテクチャ) • Berkeley の研究から • オープン・利⽤無料の ISA (32bit, 64bit, 128bit) • チップやソフトウェアを誰もが⾃由に設計・製作・販売可能 RISC-V コアを Chisel で書いたり RTL の形で GitHub へ GO! など • SiFive, Andes, Western Digital など実装(商⽤)多数あり • JASA(組み込みシステム技術協会)に RISC-V WG 発⾜ 標準組込みプラットフォームへ:SHコンサルティングの河崎さんら 128bit は事実上予約のみ状態の慎重さ =誤った予測で将来の負債を作らない
  • 21. 2018, 2019 の RISC-V Summit, US での状況報告など • “中国は現在、数百種類のRISC-V SoCや数⼗種類のコアの開発を進めている ようだ” • デンソー⼦会社のIPベンダNSITEXEがSmartDVのTileLink向け検証IPを採⽤ • 地政学的リスクが却って押している? Samsung が 5G モデムと AI エッジ(画像処理)側に RISC-V を採⽤ Alibaba 傘下企業から 64bit core (Xuantie 910, 16cores, 2.5(!)GHz) RISC-V Foundation ⾃体も本部をスイスに移す計画 http://eetimes.jp/ee/articles/1812/10/news066.html から抜粋 https://www.eda-express.com/2019/12/risc-v-summit-2019risc-v.html など参照
  • 22. ⾝近なシリコン • M5StickV K210 (64bit dual core, FPU, NN engine, 400MHz, TSMC 28nm) + LCD, Camera, Gyro などなど付いて 3000円で⼤⼈気 • HiFive Unleashed board - $999 with 8GB DDR4, 1GbE SiFive FU540 chip - TSMC 28nm, 64bit Quad core, 1.5GHz+, MMU有で Linux 動作 Open Source RTL - https://github.com/sifive/freedom
  • 23. source: SiFive presentation at RISC-V Workshop in Barselona, 2018 May https://content.riscv.org/wp-content/uploads/2018/05/09.25-09.55-tate-of-RISC-V-Software-RISC-V-Workshop-at-Barcelona-May-2018-1.pdf
  • 24. ハイエンド・コア:⼩規模システムだけでない • SiFive (⽶国) U8 Core IP : 64bit, 3命令 Superscalar / Out-of-Order, マルチコア対応, MMU あり なお SiFive はコアだけで無く関連技術も多数開発 • HBM2E+ : 7nm 検証済, 400Gbps (or ピンあたり3.2Gbps) • Shield : RISC-V の TEE (Trusted Execution Environment) 実装, Arm TrustZone 相当 (AIST(産業技術総合研究所)の須崎さんらも⼿掛けている) • Andes (台湾) NX27V : 64bit, 1.1GHz, Vector Processor Unit あり • Alibaba Xuantie 910 : 64bit, 16cores, Out of Order, 2.5(!)GHz, “for AI and 5G” << お決まり
  • 25. 拡張命令セットのアイディア • ベース ISA は超シンプル 整数レジスタ32本(0番はゼロ固定) load, store, and/or/xor, add, sub, compare, branch, jump, nop 程度 • 多くの「拡張命令(オプション)」 Standard Extension:⼀般的で互いに衝突しないように設計 → 整数の乗除命令・アトミック命令・単・倍精度の浮動⼩数点命令すら拡張で Non-Standard Extension:特化+他 Extension との衝突を許容 Embedded向け16本のRV32Eもある (Standard Extension との conflict も許容)
  • 36. Codasip Studio - ハード開発とソフト開発の連携 • CodAL : C/C++ ライクな⾔語で記述 命令セット定義と、マイクロアーキテクチャ定義 の 2 レベルで書く この時、パイプラインの構造なども書ける • 命令セットを定義すると コアを⾃動合成して RTL で吐き SDK (Compiler, Debugger, etc.) もできる • オレオレ拡張命令を作って即デバッグ・テスト可能 • 標準RISC-Vコア(インオーダー)は提供される アウトオブオーダーなども書ける(だろう) 顧客のために書く仕事もする(⾮オープンでやる) http://riscv-association.jp/wp-content/uploads/2019/10/Codasip-RISC-V-Day-Japan-2019.pdf
  • 38. いまどきの Domain Specific Hardware • Massive Parallel Processing : ノイマン型の苦⼿分野 • 迅速な Software 対応 既存の互換レイヤーへの対応でひとまずはOK CS-1 : TensorFlow, PyTorch RISC-V : Open Source のパワーを最⼤限利⽤ • Ajail Hardware Development RISC-V : 振り向けくと増えてる CS-1 : Brain Storming から 4.5 年 「むかし、ハードウェア開発は Waterfall だった」 と⾔われる (?)