深層学習 - 画像認識のための深層学習 ②

1
画像認識め深層学習
深層学習 (人工知能学会) 第５章

2
担当範囲
1. 階層ューワー深層学習(田代)
2. 深層ンン(扱わい)
3. 事前学習周辺(高橋)
4. 大規模深層学習実現技術(山内)
5. 画像認識た深層学習

3
こ発表目標
1. 画像認識深層学習背景知
2. 畳込ューワー (CNN) 理解
3. CNN 用い画像認識や方理解
4. CNN たきを知
5. 教師し学習画像認識手段を知

4
CNN 強い
従来法圧倒結果生

5
一般物体認識難しさ
一般物体認識 = general object recognition
研究自体 90年代遡
当時難解決相当時間思わ
 難い？
 無視べ画像変動鈍感特徴抜出不変性
 類似区別識別力
相対概念見え

6
従来一般物体認識方法
分類いう問題特徴抽出分類段階分離捉え
後半分類ーベンベ付ンプ用い
教師あ学習処理さ
特徴手動設計取出難さ
特徴抽出
(手動設計)
分類
(教師あ )
特徴

7
局所特徴大域特徴
局所特徴(local feature)
画像局所的小領域考え、濃淡特徴量
取出言う
大域特徴(global feature)
画像上選多数小領域対別々局所特徴抽出、
符号化びプーン上、
入力画像枚全体表特徴量

8
局所特徴(SIFT 抽出)
SIFT(Scale Invariant Feature Transform) 最古、
一番良使わい手法、2 プ構成さ
1. 画像内ほ区別やい顕著特徴持点選び出、
同時周囲局所的濃淡構造大さ従見べ領域
大さ向決定 *
2. 領域内部濃淡構造表特徴量取出
*物体認識局所領域位置・大さ・向格子状機械的取多い

9
他局所特徴抽出方法
SIFT 変わ数多局所特徴提案さ、
性能向上度合いそほ大きでい
 提案中わい段階経
特徴抽出必要ああ
局所領域対、複数フ並列適用、結果何
非線形関数適用、後プーン行ういう構造

10
符号化
抽出局所特徴対符号化(Encode) 、付行う
ビュワー
自然画像多様性極大い、局所部分多様性ほ
、有限(数百〜数千) 典型例類型化さ仮定
 典型例ビュワー名付
多数画像多数点取出特徴量集合対、
ン実行、得数百〜数千程度中心得代
表ベビュワー

11
Bag of Features
予用意いビュワー用い画像枚全体表現得
方法いあ、最基本 bag-of-features 用い
各点局所特徴同特徴空間代表点あビュ
ワーう最近傍置換え量子化
犬さ
猫さ
うささ
ビュワー局所特徴
うさい

12
プーン
符号化さ画像特徴帯域特徴得
局所特徴
大域特徴局所特徴
局所特徴
うささ
さ
うささ
局所特徴抽出符号化プーン

13
従来法成功し理由
以上方法一般物体認識対、以前予想覆
成功収
 理由プーンい、局所特徴位置情報潔
捨あさ
同一見目変動対不変性実現
 、識別力局所特徴依存為、明限界あ

14
従来法 CNN 比較
従来法 CNN 共通点
従来法局所特徴抽出→プーンいう手順
CNN 畳込層→プーン層いう手順極似い
従来法 CNN 相違点
従来法局所特徴抽出際フ設計決、
CNN フ ( ) 学習決定さ
 、CNN 第層学習フ経験的設計さ従来法フ
大違わい

15
CNN 学習すフィタ
上図 MNIST 学習さ CNN 段階目フ
自然画像入力場合学習さフガボーフィタ
類似無色フ色や色変化関フ分さ
事多い

16
ガーフィタ
ガボーフィタ向概念持、
フあ
画像中向線含い
抽出フあ
具体的次元ン波次元
ウ関数積生成さ
ーフ例
ーフ適用例

17
従来法(SIFT) 採用さい計算
SIFT ８方向勾配方向計算行い
 CNN 学習フ用い畳込行う
同様働考え
CNN 色関フ同時得、従来法
SIFT 別色特徴抽出使用い
 従、段階目計算従来法 CNN 大差い思え

18
従来法大壁
局所特徴抽出う入力近い層工学的設計
 、CNN 学習発見中〜上位層特徴同
う設計
 従来法 CNN 性能分理由あ言え

19
ネットワー構造認識性能
CNN 高い性能示理由従来法違い求
 CNN 多層性
 CNN 構造
(画像取出特徴学習獲得柔軟性持 )
う本質的う？

20
CNN 構造理由あす考え
Jarrett 畳込層フン値セ、
全結合層学習多項ロ回帰場合十分
認識率達成事示
全結合層学習場合 : 53.3%
フ学習場合 : 54.8%
※ し、こ学習サンプ数少い場合みあ、
学習サンプ十分あ場合、フィタ学習効果を発揮す

21
CNN 部表現
CNN 内部一体何表現い

22
CNN 謎迫
CNN 成功鍵多層構造
、畳込層プーン層繰返構造有用
、説得力あ説明見いい
第層 SIFT 似い、働理解、
以降全体ういう働いわい
CNN 入力ー何、う表現いう？

23
可視化
学習後 CNN 角層何い可視化試
単純各層フ画像見多い
、何読取難い

24
逆畳込みネットワー
Zeiler 逆畳込ワーいう独自考え CNN
中間層各ー何見い可視化
入力画像成分注目ー出力値決定
取出表示
 結果ワー層構造対応階層性示さ

25
階層性
階層深連活性化ーン複雑化
斜め線
縦線
縦線
横線
耳
胴体
目
胴体
うさ耳
うさ胴体
うさ目
こ胴体
楕
五角形
長方形

26
脳神経系関係
 高次視覚野脳皮質多点電極刺、状態自
然画像見電極神経細胞活性ーン記録
学習済 CNN 同画像入力、上位層ー活性
ーン記録
CNN 取出活性ーン用い神経細胞
振舞い回帰高い精度予測可能

27
転移学習
CNN 含多層NN 魅力学習通入力ー
良い特徴取出う
 多層NN 学習魅力的性質うあ
あ程度異認識間学習さ特徴共通性あ

28
多層NN 階層性
逆CNN 項述べう多層NN 学習特徴層構造
対応階層性持
下位層特徴普遍性持異間共有
上位層特徴依存性高い
従、下位層 NN 転移学習利用可能性

29
下位層普遍性利点
一般物体認識学習 CNN 用意
 CNN 学習自体一般物体認識目的、
学習ー規模大
新い認識学習う学習 CNN 取出特徴
ーベン等分類
 従大規模学習ー必要い
方法達成認識精度数多認識い従来法
凌高いわい

30
教師し学習画像認識
自己符号化器多層ワー

31
単層自己符号化器局所特徴学習
画像局所領域(パチ) 対象行う
局所領域特徴学習
ーソウ 3
特徴抽出

32
自己符号化器さい
得入力ー次元削減(Dimensional Reduction)
目標教師学習
次元削減要、入力特徴適切抜出
主目的い
順方向逆方向伝搬さ元信号近う
重学習行う

33
単層自己符号化器局所特徴学習
具体的方法
 ーーン
 フ独立成分分析
 再構成型TICA(Topographic Independent Component Analysis)
 パー自己符号化器
 ー RBA(Restricted Boltzmann Machine)
名前紹介、具体的内容割愛…

34
パー自己符号化器
 ワー構成
入力層
ー数 : 𝑆 × 𝑆個
S
S
入力画像
切出
出力層
ー数 : 𝑁 < 𝑆 × 𝑆 個
𝑾 𝒏𝒆𝒕 𝑎 𝒏𝒆𝒕
= 𝑎 𝑾 + 𝒃
ロティ関数
𝒃

35
ロティッ関数
=
𝐾
+ 𝑟 𝑥0−𝑥
 関数種
𝐾 = , = , 𝑟 =
 左図ー適当設定
ロ関数

36
自己符号化器以下う表
𝒊 − 𝟐
𝒊
最小化
= 𝑎 𝑾 + 𝒃
= 𝑎 𝑾 + 𝒃
自己符号化器ー正則化加え
 ー性 : 0 い値事少う
出力層ー入力毎活性化う制約

37
𝑁 𝒊 − 𝒊
𝟐
+ 𝛽 𝐷 𝜌 || 𝜌
# of units
=𝒊
𝐷 𝜌 || 𝜌 ー正規化項 𝜌 log
𝜌
𝜌 𝑗
+ − 𝜌 log
−𝜌
−𝜌 𝑗
𝜌 全学習ンプ渡ー平均活性度
𝑁
𝜌 平均活性度目標値
# of units ー数

38
パー自己符号化器使用例
CIFAR-10* 対象局所特徴抜出
 特徴教師あ学習組合わ目的実行
*一般物体認識ーセ (http://www.cs.tronto.edu/~kriz/cifar.html)

39
多層ネットワー特徴学習
先ほー自己符号化器例単層ワー
単層ワー何層積上積層自己符号化器使同様
教師特徴学習行う考え
 視覚野 V2領域ューロン取出言わいーーや
ンョン上画像特徴層深層信念ワー学習
獲得いう報告
 RBM 、個積上深層ンン(DBM) 使
特徴学習行結果MNIST 当時最高水準認識性能

40
深層学習…？
先ほ例う学習高々，層程度ワー
あ、層数増や性能差対認
い場合や層方性能高い場合
多層性効果示いい

41
畳み込み層プーン層を持べ
教師学習興味深い結果 CNN同様畳込
層プーン層持ワー使得
1. 畳み込み深層信念ネトワー
2. 再構成型トポラフィッ独立成分分析

42
畳み込み深層信念ネットワー
畳込深層信念ワー = Convolutional deep belief network
CNN同様畳込層プーン層交互積重構造持
ワー持ボマンマン
 畳込層ー間結合疎ー間重共有形特殊 RBM
 ー正則化適用さ
 各ー振舞い確率的記述確率的最大プーン新導入
自然画像対象教師学習行
階層的特徴学習さ

43
トフィッ独立成分分析
入力層、中間層、出力層層
構造 NN 用い特徴学習
出力層ーー
活性化う 𝑊 最適化
 𝑊 以下制約加え
𝑊𝑊 𝑇
= 𝐼
入力層
𝑾
中間層出力層
プーン層

44
トフィッ独立成分分析
特徴学習方法
TICA 以下う表
min
𝑊
𝜀 +
 𝜀 + 局所ン正規化時出関数、
小さ値無視大値正規化事
𝜀 小さ正定数

45
再構成型トフィッ独立成分分析
標準的 TICA 𝑊𝑊 𝑇
= 𝐼 制約中間層ー数
入力層小さい前提あ
 TICA 冗長特徴表現い
再構成型TICA(reconstruction TICA) 自己符号化器同様
再構成誤差最小化 TICA 組込方法
TICA 重対直交性制約再構成誤差最小化
置換え形→冗長基底学習可能

46
教師し学習畳込みプーン必要性
前述、教師学習畳込層やプーン層
構造埋込良い結果得
うい構造持い場合大画像扱う場合ワー
規模大いう欠点あ
、畳込層構造必要理由
無いう思わ

深層学習 - 画像認識のための深層学習 ②

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Destaque

Destaque (12)

Semelhante a 深層学習 - 画像認識のための深層学習 ②

Semelhante a 深層学習 - 画像認識のための深層学習 ② (20)

深層学習 - 画像認識のための深層学習 ②