SlideShare uma empresa Scribd logo
1 de 10
Baixar para ler offline
ACRi討論会 ポジショントーク
2022年5⽉25⽇
北海道⼤学 ⼤学院情報科学研究院 情報エレクトロニクス分野
集積ナノシステム研究室 (LALSIE) 助教
安藤 洸太
自己紹介
p プロフィール
Ø 安藤 洸太(アンドウ・コウタ)
Ø 2016.3 北海道⼤学 ⼯学部 卒業 (学⼠(⼯学))
Ø 2018.3 同 ⼤学院情報科学研究科 修了 (修⼠(情報科学))
Ø 2021.3 東京⼯業⼤学 ⼯学院 修了 (博⼠(⼯学))
Ø 2021.4〜2022.3 東京⼯業⼤学 科学技術創成研究院 特任助教
Ø 2022.4〜 北海道⼤学 ⼤学院情報科学研究院 助教
p 研究紹介
Ø ニューラルネットワーク (NN) のエッジ推論
システムを中⼼に,ハードウェア技術と
その周辺アルゴリズムの
協調的研究に取り組んでいます
Ø BRein Memory (2017):
⼆値化NNを⽤いたニアメモリ推論LSI
Ø Dither NN (2018): 軽量NNハードウェアでの
認識精度向上とその学習アルゴリズム
1
“BRein Memory” チップ写真
×
+
量子化
A W
×
+/-
量子化
A W
“Dither NN” 演算部
誤差累算
SRAM
読出しレジスタ
アドレスデコーダ
p SRAMの並列性
D R A M
従来のアクセラレータ
Proc.
SRAM
Proc.
オンチップ構成
p 係数SRAM直近での軽量な演算→ 超並列化の可能性
Ø メモリ容量
F
P
1
6
⼆
値
1/16
データ
サイズ
Ø 計算資源
×
FP16乗算器:
~30k ゲート
⼆値:
XNORゲート
O (1/10k)
ワード間
⾏逐次
Word
ワード内
列並列
p ⼆値化NN [M. Courbariaux, 2016] の登場
BRein Memory: 二値化NN推論LSI
2
SRAM
読出しレジスタ
Addr.
Dec.
三値NNインメモリ処理モジュール
3
SRAM
Addr.
Dec.
読出しレジスタ
処理回路
処理回路
出⼒活性
(逐次)
中間層
活性
出⼒
Index
出⼒並列
⼊⼒並列
⼊⼒
Index
⼊⼒活性
(逐次)
各出⼒
への
係数
各⼊⼒
からの
係数
完全パイプライン
並列処理
⼆値化による
軽量化
NNの並列性
×
SRAMの並列性
Processing-in-Memory Module;
PIM
“BRein Memory” (Binary/Ternary Reconfigurable in-Memory)
4
プロセス 65nm GP
ダイサイズ 4 x 3 mm2
コアサイズ 3.9 mm2
動作周波数 400 MHz
電圧 1.0 V
消費電⼒ 0.58 W
VLSI 2017 にて発表 (北⼤、東⼯⼤︓中原研、慶應︓⿊⽥研)
テスト回路 13層全結合NN搭載可能
効率
[OPS/W]
対CPU⽐
BRein 2.6万
FPGA 33
GPU 9
CPU 1
派生構想 〜 二次元再構成アレイ
5
縦列接続
→「深い」NN(多層)
分岐・統合接続
→「広い」NN(多Ch)
環状接続
→再帰NN
NN層数,層サイズ,トポロジに対する再構成可能アレイ……︖
スイッチブロック
Dither NN: 量子化NNとリファレンスFPGA実装評価
p ディザ
Ø 信号処理(画像処理)で多⽤
Ø 階調表現を保って量⼦化
Ø 例:
6
p 量⼦化NNのハードウェア
Ø 活性と係数を量⼦化して軽量化
Ø 内部演算は⾼ビット精度
Ø 情報の⽋落
×
+
量⼦化
A
W
係数
活性
⾼
閾値⼆値化
ディザ
低 低
ビット
精度
ディザとDNN
p アルゴリズム … 誤差拡散法
Ø 量⼦化誤差を蓄積・累算
Ø 加減算のみで実現
7
⼊⼒
#1
出⼒
1
0
閾値
1
0
閾値
⼊⼒
#2
量⼦化誤差
p ハードウェア実現
Ø NNアーキテクチャは
並列化されたアキュムレータ︔
つまり加算器の集合︕
×
+
量⼦化
A W
×
+/-
量⼦化
A W
選択回路のみで実現可︕
Dither NN 評価
p Zynq 7000に実装評価した。追加LUT 1%未満を達成
Ø VerilogとVeriloggen [https://github.com/PyHDI/veriloggen] でサクッと並列アーキを書いた
Ø FPT’18 Best Paper Award 受賞
8
Ø “ディザ無” Act-PE Ø “ディザ有” Act-PE
ü 誤差拡散の計算にはア
キュムレータの加算器
を流⽤可能
ü 必要なのは単純な選択
回路のみ
+
0
Sign
部分和⼊⼒
Acc.
RST
活性出⼒
+
0
Sign
部分和⼊⼒
Acc.
RST
活性出⼒
ディザ
OP
PE
PE
PE
Act
Wgt.
IN OUT
PE
PE
PE
Act
Wgt.
PE
PE
PE
Act
Wgt.
総括
p 基本的にはチップ屋
p FPGA as ……
Ø 研究対象そのもの︖
ü ポストFPGAを現状考えているわけではない
Ø 表現の場
ü Dither NNは実験の⼟俵にFPGAを選び、
サクッと評価した
Ø 便利な道具 →
ü 周辺回路、特にI/Fは⾃分で作りたくない︕
ü FPGAだとこの辺はラク
p FPGAに⼀⾔
Ø Programmable “Gate” Array って本当︖
9
毎度お世話になります
ZC702さん
“Descartes” チップ 測定デモ
https://youtu.be/x36MzIwpI9M

Mais conteúdo relacionado

Semelhante a 220526_ACRi_Ando01r.pdf

Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォームAutoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Takuya Azumi
 
最先端学術情報基盤(Csi)委託事業報告交流会パネル
最先端学術情報基盤(Csi)委託事業報告交流会パネル最先端学術情報基盤(Csi)委託事業報告交流会パネル
最先端学術情報基盤(Csi)委託事業報告交流会パネル
National Institute of Informatics (NII)
 

Semelhante a 220526_ACRi_Ando01r.pdf (20)

Scrum × PBL × チケット駆動開発
Scrum × PBL × チケット駆動開発Scrum × PBL × チケット駆動開発
Scrum × PBL × チケット駆動開発
 
学生とシビックテック
学生とシビックテック学生とシビックテック
学生とシビックテック
 
九州大学教育ビッグデータプロジェクト ~ラーニングアナリティクス(LA)の活用~
九州大学教育ビッグデータプロジェクト ~ラーニングアナリティクス(LA)の活用~九州大学教育ビッグデータプロジェクト ~ラーニングアナリティクス(LA)の活用~
九州大学教育ビッグデータプロジェクト ~ラーニングアナリティクス(LA)の活用~
 
20200804 AXIES
20200804 AXIES20200804 AXIES
20200804 AXIES
 
220529 VR Seminar
220529 VR Seminar220529 VR Seminar
220529 VR Seminar
 
これから始めるディープラーニング
これから始めるディープラーニングこれから始めるディープラーニング
これから始めるディープラーニング
 
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォームAutoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
 
Casual learning machine_learning_with_excel_no1
Casual learning machine_learning_with_excel_no1Casual learning machine_learning_with_excel_no1
Casual learning machine_learning_with_excel_no1
 
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
【慶應大学講演】なぜ、博士課程に進学したか?
【慶應大学講演】なぜ、博士課程に進学したか?【慶應大学講演】なぜ、博士課程に進学したか?
【慶應大学講演】なぜ、博士課程に進学したか?
 
最先端学術情報基盤(Csi)委託事業報告交流会パネル
最先端学術情報基盤(Csi)委託事業報告交流会パネル最先端学術情報基盤(Csi)委託事業報告交流会パネル
最先端学術情報基盤(Csi)委託事業報告交流会パネル
 
情報システム創成研究分野への誘い
情報システム創成研究分野への誘い情報システム創成研究分野への誘い
情報システム創成研究分野への誘い
 
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
 
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
 
オープンデータと博物館
オープンデータと博物館オープンデータと博物館
オープンデータと博物館
 
参加者アンケートからみるOSC
参加者アンケートからみるOSC参加者アンケートからみるOSC
参加者アンケートからみるOSC
 
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
ものづくりに活かす数学 (2024 年 1 月 26 日 N/S 高等学校での数学の授業)
ものづくりに活かす数学 (2024 年 1 月 26 日 N/S 高等学校での数学の授業)ものづくりに活かす数学 (2024 年 1 月 26 日 N/S 高等学校での数学の授業)
ものづくりに活かす数学 (2024 年 1 月 26 日 N/S 高等学校での数学の授業)
 

Mais de 直久 住川

Mais de 直久 住川 (20)

公開用_講演資料_SCSK.pdf
公開用_講演資料_SCSK.pdf公開用_講演資料_SCSK.pdf
公開用_講演資料_SCSK.pdf
 
ACRi-Webinar_Feb2023_agenda_20230225.pdf
ACRi-Webinar_Feb2023_agenda_20230225.pdfACRi-Webinar_Feb2023_agenda_20230225.pdf
ACRi-Webinar_Feb2023_agenda_20230225.pdf
 
第11回ACRiウェビナー_東工大/坂本先生ご講演資料
第11回ACRiウェビナー_東工大/坂本先生ご講演資料第11回ACRiウェビナー_東工大/坂本先生ご講演資料
第11回ACRiウェビナー_東工大/坂本先生ご講演資料
 
第11回ACRiウェビナー_インテル/竹村様ご講演資料
第11回ACRiウェビナー_インテル/竹村様ご講演資料第11回ACRiウェビナー_インテル/竹村様ご講演資料
第11回ACRiウェビナー_インテル/竹村様ご講演資料
 
2022-12-17-room.pdf
2022-12-17-room.pdf2022-12-17-room.pdf
2022-12-17-room.pdf
 
ACRiルーム副室長_安藤様_講演資料
ACRiルーム副室長_安藤様_講演資料ACRiルーム副室長_安藤様_講演資料
ACRiルーム副室長_安藤様_講演資料
 
DSF実行委員長_酒井様_講演資料
DSF実行委員長_酒井様_講演資料DSF実行委員長_酒井様_講演資料
DSF実行委員長_酒井様_講演資料
 
ACRi事務局_住川_講演資料
ACRi事務局_住川_講演資料ACRi事務局_住川_講演資料
ACRi事務局_住川_講演資料
 
VCK5000_Webiner_GIGABYTE様ご講演資料
VCK5000_Webiner_GIGABYTE様ご講演資料VCK5000_Webiner_GIGABYTE様ご講演資料
VCK5000_Webiner_GIGABYTE様ご講演資料
 
AMD_Xilinx_AI_VCK5000_20220602R1.pdf
AMD_Xilinx_AI_VCK5000_20220602R1.pdfAMD_Xilinx_AI_VCK5000_20220602R1.pdf
AMD_Xilinx_AI_VCK5000_20220602R1.pdf
 
VCK5000_Webiner_Fixstars様ご講演資料
VCK5000_Webiner_Fixstars様ご講演資料VCK5000_Webiner_Fixstars様ご講演資料
VCK5000_Webiner_Fixstars様ご講演資料
 
第9回ACRiウェビナー_セック/岩渕様ご講演資料
第9回ACRiウェビナー_セック/岩渕様ご講演資料第9回ACRiウェビナー_セック/岩渕様ご講演資料
第9回ACRiウェビナー_セック/岩渕様ご講演資料
 
第9回ACRiウェビナー_日立/島田様ご講演資料
第9回ACRiウェビナー_日立/島田様ご講演資料第9回ACRiウェビナー_日立/島田様ご講演資料
第9回ACRiウェビナー_日立/島田様ご講演資料
 
20220525_kobayashi.pdf
20220525_kobayashi.pdf20220525_kobayashi.pdf
20220525_kobayashi.pdf
 
2205ACRi_jinguji.pdf
2205ACRi_jinguji.pdf2205ACRi_jinguji.pdf
2205ACRi_jinguji.pdf
 
ACRiポジショントーク_山科.pdf
ACRiポジショントーク_山科.pdfACRiポジショントーク_山科.pdf
ACRiポジショントーク_山科.pdf
 
ACRiウェビナー:小野様ご講演資料
ACRiウェビナー:小野様ご講演資料ACRiウェビナー:小野様ご講演資料
ACRiウェビナー:小野様ご講演資料
 
ACRiウェビナー:岩渕様ご講演資料
ACRiウェビナー:岩渕様ご講演資料ACRiウェビナー:岩渕様ご講演資料
ACRiウェビナー:岩渕様ご講演資料
 
ACRiウェビナー:アジェンダ
ACRiウェビナー:アジェンダACRiウェビナー:アジェンダ
ACRiウェビナー:アジェンダ
 
Noriyuki Aibe, "High Efficiency Connection Method on Electric Signal Lines be...
Noriyuki Aibe, "High Efficiency Connection Method on Electric Signal Lines be...Noriyuki Aibe, "High Efficiency Connection Method on Electric Signal Lines be...
Noriyuki Aibe, "High Efficiency Connection Method on Electric Signal Lines be...
 

220526_ACRi_Ando01r.pdf