8. 8
GANのデファクトスタンダードの変遷
DCGAN
Deep Convolutional GAN
2015
GAN
Generative Adversarial Nets
2014
WGAN
Wasserstein GAN
2017
WGAN-GP
WGAN-Gradient Penalty
2017
BigGAN
Big GAN
2018
SAGAN
Self Attention GAN
2018
PGGAN
Progressive Growing GAN
2017
Style GAN
Style GAN
2019
NVIDIAの系譜
DeepMind
Goodfellow
CVPR2020でStyle GANを利用・改造した論文多数あり!
14. 14
Consistencyの工夫 (2/4)
• Breaking the Cycle - Colleagues Are All You Need
– Cycle-Consistency 制約を除いた論文
• 1つのgeneratorと2つのdiscriminatorからなる組(council)を複数作成
• 入力画像のドメインを判定するdiscriminatorと、入力画像が自身の所属するcouncilの
generatorが生成したものかどうかを判定するdiscriminatorを使用
• generatorは他のcouncilのgeneratorの出力に寄せる必要が出てくるので、結果として
cycle-consistencyなしでも文脈が保存される。
23. 23
single viewからの3Dshape復元
• Unsupervised Learning of Probably Symmetric
Deformable 3D Objects from Images in the Wild
– CVPR Best Paper
– 教師や事前モデルなしに3D shapeを復元できる
• 画像のsymmetryの特性に注目している
• symmetryを得るのは難しいので照明の確率マップを用いる
• 各入力画像を奥行き,アルベト,視点,照明に因数分解するAEを用いる
• symmetryかどうかの確率マップも用いる
24. 24
SynSin:画像から新規視点画像を生成
SynSin: End-to-End View Synthesis From a Single Image
– 複雑なリアルシーン画像に対応かつEnd-to-End生成
– 1枚の画像から複数視点を生成
• そのために特徴マップ,深度マップを推測
• そこから微分可能なレンダラーを導入し,3Dの点群を用意
• GAN構造を用いている
– 他のタスクへも応用可
25. 25
StyleGAN×3D 顔リグ
• StyleRig: Rigging StyleGAN for 3D Control Over Portrait
Images
– 新しいタスクを切り開いた
• 今までは顔の内部のモデルをいじれるor目・鼻などの生成のみだった
– StyleGAN画像をフェイスリグのようにコントロール
• 頭部のポーズ,表情,照明をミックスできる
– 訓練は自己教師付二重cycle consistencyに基づく
26. 26
texture付き3D shape生成
• Leveraging 2D Data to Learn Textured 3D Mesh
Generation
– 形状だけでなくテクスチャ付き3Dオブジェクト(Mesh)を生成できる
– 3D Meshのデータセットではなく2D画像のデータセットを学習
• 画像を2D背景+3Dオブジェクトと解釈
• 任意の画像を生成する潜在パラメータを生成するEncoder +
colored 3D meshを生成するDecoder+背景のGenerator
– self-intersectionsを解決
27. 27
自然な3Dテクスチャの生成
• Learning a Neural 3D Texture Space from 2D Exemplars
– 多様性,視覚的忠実度,計算効率がよい2D or 3Dの自然テクスチャ
の生成
• 歴史あるperlin noiseをdeepに,非線形に
– 新しいテクスチャに対して再学習の必要なし
• 無限ドメインのサポート
– 学習は2D画像のみ