SlideShare uma empresa Scribd logo
1 de 20
Attention-Guided GAN について
Unsupervised Attention-guided Image-to-Image Translation
Youssef A. Mejjati, et al. In NIPS, 2018.
2018.10.29
hei4
画像変換系の GAN
訓練データは変換前後の Paired 訓練データは Unpaired
●
訓練データが変換前後で Paired なものと、 Unpaired なものがある
●
Paired (例 pix2pix ) :タスクによってはデータをペアで用意することが困難
●
Unpaired (例 CycleGAN 、 DiscoGAN など) :利便性が高い
CycleGAN の課題
Jun-Yan Zhu, et al. 2017 より
●
CycleGAN は高精細な画像変換に成功
●
一方で背景画像は変換が成功していない(=不要に変換している)
●
Unpaired な訓練データで、背景画像も高精細にすることはできないか?
本日紹介する論文
● “Unsupervised Attention-guided Image-to-Image Translation”
●
Youssef A. Mejjati, et al.  英国バース大学の研究チーム
●
NIPS 2018 のポスターに採択
Unpaired な既存手法の課題
既存手法提案手法
●
前景画像に対しては高精細な画像変換に成功している手法でも、
 背景画像は改善の余地あり
●
アテンション構造で課題を解決する、 Attention-Guided GAN を提案(本手法)
Attention-Guided GAN の構造
アテンションネットワーク
ジェネレーター
(ソース→ターゲット)
ソース画
像
アテンショ
ンマップ
ソース画
像
前景
贋作
ターゲット画
像
前景
贋作
ターゲット画
像
前景(調整
後)
Attention-Guided GAN の構造
ソース画
像
贋作
ターゲット画
像
前景(調整
後)
反転した
アテンショ
ンマップ
ソース画
像
背景
贋作
ターゲット画
像
Attention-Guided GAN の構造
贋作
ターゲット画
像
ソース画
像
アテンションネットワーク
ジェネレーター
(ソース→ターゲット)
ソース画
像
再構築画像
贋作ターゲット画
像
AT
?
ディスクリミネーター
(ターゲット)χT
?
Attention-Guided GAN の構造
adversarial loss
AT
?
χT
?
cycle consistency loss
元画像 贋作画像
Attention-Guided GAN の損失
adversarial loss
cycle consistency loss
全体の loss
ハイパーパラメータ: λcyc
= 10
学習の工夫 (Attention-guided Discriminator)
元画像 贋作画像 背景部分は、元画像も贋作画像も同じ
ディスクリミネーターで背景部分について
識別および学習する意義はない
●
前景部分のみ学習すればよい。
 ただし、前景と背景に分離できている
 (=正しくアテンションできている)必要がある
●
30 エポック以降から、前景のみで学習
●
30 エポック以降はアテンションネットワークは
 ゆるやかに学習(学習率 100 分の 1 に)
ハイパーパラメータ: τ = 0.1
アルゴリズム
アテンションマップの生成例
●
アテンションネットワークによって前景部分にアテンションが行われている
horse で学習 zebra で学習
horse も zebra も写っていないので、アテンションなし(=背景のみ
・・・正しい結果
既存手法との定性的比較
既存手法との定量的比較
A:Apple
O:Orange
Z:Zebra
H:Horse
L:Lion
T:Tiger
●
贋作画像と元画像との Frecet Inception Distance (FID) で評価。
●
FID は特徴量に対して、曲線同士の距離を測る Frechet Distance を適用するもの
  FID が小さいほど2つの画像集合の画像的特性が近しい。
●
贋作画像と元画像をそれぞれ Inception Net に入力した最終特徴量マップを使用
●
FID を用いて定量的に評価し、既存手法と比較
●
Attention-guided GAN で変換した贋作画像が、元画像との FID が最も小さい
Attention GAN との違い
“Attention-GAN for Object Transfiguration in Wild Images”
Xinyuan Chen, et al. 2018
●
Attention-Guided GAN と Attention GAN との相違点
1.前者は前景部のみを生成器に入力して変換。後者は分離前に全体を変換
2.前者は 30 エポック以降は前景部のみを識別器に入力
構成要素の効果( Attention GAN との比較)
提案
手法
AttentionGAN
に相当
cycle consistency
loss ぬき
再構築時に再度
アテンションマップ
AT
(s’) を生成しない
アテンションネッ
トが単一
Attention-guided
Discriminator を
通常の D に
表中の値は FID
構成要素の効果( Attention GAN との比較)
AttentionGAN に相当
公式実装( TensorFlow )での動作結果
GTX1080Ti 使用 学習時間 7h
総括
●
アテンション構造を使った Attention-Guided GAN を提案
●
既存の Unpaired な画像変換手法と比較して、
 定性的・定量的に高精細な画像変換を達成
●
AttentionGAN と比較して、アテンションされた前景部分を変換している
点、
 学習が進むと前景部分のみを識別器で判断している点が異なる
●
AttentionnGAN よりも高精細に変換できることを確認

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)
 
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
 
[DLHacks]StyleGANとBigGANのStyle mixing, morphing
[DLHacks]StyleGANとBigGANのStyle mixing, morphing[DLHacks]StyleGANとBigGANのStyle mixing, morphing
[DLHacks]StyleGANとBigGANのStyle mixing, morphing
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
 
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
 
【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成
 
[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks
 
[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
 
動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット
 
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 

Semelhante a Attention-Guided GANについて

Semelhante a Attention-Guided GANについて (7)

Few-Shot Unsupervised Image-to-Image Translation
Few-Shot Unsupervised Image-to-Image TranslationFew-Shot Unsupervised Image-to-Image Translation
Few-Shot Unsupervised Image-to-Image Translation
 
[DL輪読会]Deep Face Recognition: A Survey
[DL輪読会]Deep Face Recognition: A Survey[DL輪読会]Deep Face Recognition: A Survey
[DL輪読会]Deep Face Recognition: A Survey
 
Bridging between Vision and Language
Bridging between Vision and LanguageBridging between Vision and Language
Bridging between Vision and Language
 
SPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
SPADE :Semantic Image Synthesis with Spatially-Adaptive NormalizationSPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
SPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
 
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
 
【CVPR 2019】Do Better ImageNet Models Transfer Better?
【CVPR 2019】Do Better ImageNet Models Transfer Better?【CVPR 2019】Do Better ImageNet Models Transfer Better?
【CVPR 2019】Do Better ImageNet Models Transfer Better?
 
【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
 

Mais de yohei okawa

Mais de yohei okawa (15)

Explainable predictions pattern
Explainable predictions patternExplainable predictions pattern
Explainable predictions pattern
 
Model versioning pattern
Model versioning patternModel versioning pattern
Model versioning pattern
 
Workflow pipeline pattern
Workflow pipeline patternWorkflow pipeline pattern
Workflow pipeline pattern
 
Transform pattern
Transform patternTransform pattern
Transform pattern
 
Keyed predictions pattern
Keyed predictions patternKeyed predictions pattern
Keyed predictions pattern
 
Batch serving pattern
Batch serving patternBatch serving pattern
Batch serving pattern
 
Distribution Strategy pattern
Distribution Strategy patternDistribution Strategy pattern
Distribution Strategy pattern
 
Useful Overfitting pattern
Useful Overfitting patternUseful Overfitting pattern
Useful Overfitting pattern
 
Multilabel pattern
Multilabel patternMultilabel pattern
Multilabel pattern
 
Reframing パターン
Reframing パターンReframing パターン
Reframing パターン
 
20190630_VoVNet
20190630_VoVNet20190630_VoVNet
20190630_VoVNet
 
はじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルはじめての方向け GANチュートリアル
はじめての方向け GANチュートリアル
 
semantic segmentation サーベイ
semantic segmentation サーベイsemantic segmentation サーベイ
semantic segmentation サーベイ
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎
 
CycleGANについて
CycleGANについてCycleGANについて
CycleGANについて
 

Attention-Guided GANについて