SlideShare uma empresa Scribd logo
1 de 41
Baixar para ler offline
第13回関西CVPRML勉強会
   ICCV祭 文献紹介

          y2squared
紹介する文献
“Distributed Cosegmentation via Submodular
  Optimization on Anisotropic Diffusion”
Gunhee Kim, Eric E. Xing, Li Fei-Fei, Takeo Kanade
(Li Fei-FeiはStanford大, 他の3人はCMU)


    CoSandというCosegmentation手法の提案
Agenda
•   はじめに
•   务モジュラ性と拡散
•   大規模Cosegmentation(CoSand)
•   実験
•   まとめ
Agenda
•   はじめに
•   务モジュラ性と拡散
•   大規模Cosegmentation(CoSand)
•   実験
•   まとめ
Cosegmentation?
複数画像から対応物体/領域をセグメンテーション




Cosegmentation of Image Pairs by Histogram Matching-
Incorporating a Global Constraint into MRFs (CVPR’06)
                     より
Cosegmentationの応用
Web-Scaleの応用がいくつか考えられる
• 画像編集における重要領域のサジェスチョン
• 個人のアルバムによく出てくるような人物や犬
  などの領域の自動セグメンテーション
Cosegmentationの応用
Web-Scaleの応用がいくつか考えられる
• 画像編集における重要領域のサジェスチョン
• 個人のアルバムによく出てくるような人物や犬
  などの領域の自動セグメンテーション

→ほとんどのアルゴリズムがWeb-Scaleではない
• スケーラビリティ
• コンテンツの多様性・複雑性
論文のポイント!
1)CVの様々な問題に適応可能な拡散方程式ベース
  の最適化手法の提案
2)線形異方性拡散システムにおける温度は务モジュ
  ラ関数になることを証明
3)CoSand(Co-Segmentation via Anisotropic Diffusion)
  の提案(分散化可能なシステム)
論文のポイント!
1)CVの様々な問題に適応可能な拡散方程式ベース
  の最適化手法の提案
2)線形異方性拡散システムにおける温度は务モジュ
  ラ関数になることを証明
3)CoSand(Co-Segmentation via Anisotropic Diffusion)
  の提案(分散化可能なシステム)
提案法と従来法のスケーラビリティの比較

                                         M:画像数
                                         K:セグメント数
どんな問題を解くのか?
Given a system under a heat diffusion and K finite
 heat sources, where should one place all the
sources in order to maximize the temperture of the
  system? (本文より)


K個の熱源 = K個のクラスタ中心
温度 = 各ピクセルのクラスタに属す信頼度
拡散性 = 各ピクセルの特徴ベクトルの類似度
(Co)segmentationの文脈上のCoSand
K個の熱源 = K個のクラスタ中心
温度 = 各ピクセルのクラスタに属す信頼度
拡散性 = 各ピクセルの特徴ベクトルの類似度

これってSegmentation問題であって
 Cosegmentation問題ではないのでは?
(Co)segmentationの文脈上のCoSand
K個の熱源 = K個のクラスタ中心
温度 = 各ピクセルのクラスタに属す信頼度
拡散性 = 各ピクセルの特徴ベクトルの類似度



クラスタ中心の情報を画像間で共有することで
Cosegmentation問題への拡張も容易に可能
(Co)segmentationの文脈上のCoSand
K個の熱源 = K個のクラスタ中心
温度 = 各ピクセルのクラスタに属す信頼度
拡散性 = 各ピクセルの特徴ベクトルの類似度



クラスタ中心の情報を画像間で共有することで
Cosegmentation問題への拡張も容易に可能
逆に,1枚ずつの処理中心なので並列化が容易
関連研究(务モジュラ最適化)
機械学習における最適化手法の1つとして流行りつつある
 – アクティブラーニング
 – 構造化学習
 – クラスタリング
 – ランキング
务モジュラ関数の例:
 – グラフカットのカット関数
 – エントロピー
 – ガウス変数における情報利得
务モジュラ性と拡散




             この論文のストーリーも同じ流れです
http://www.nec.co.jp/rd/datamining/project/nec_datamining_seminar8.pdfより
関連研究(Cosegmentation)
• M枚の画像からK個のセグメントを検出
 – ほとんどがグラフカットベースのためK=2
 – Mも少ないものが圧倒的に多い(多くてもM≦30)


• 提案法
 – スケーラビリティが上昇(k:自由 10^3≦M)
 – Kの謝りに対する頑健性
関連研究(異方性拡散)
偏微分方程式による熱拡散のフレームワーク
 → CVへの応用の成功
 -セグメンテーション問題
 -オプティカルフローの推定
 -スムージング

提案法はセグメンテーション問題について
述べているが他の問題の解法の拡張も容易!
Agenda
•   はじめに
•   务モジュラ性と拡散
•   大規模Cosegmentation(CoSand)
•   実験
•   まとめ
http://www.nec.co.jp/rd/datamining/project/nec_datamining_seminar8.pdfより
異方性拡散の最適化
   :時刻tにおける位置xの温度
としてシステム外からの熱u(g)=0,
熱源からの熱u(s) = 1 ,セグメント数Kとして
各位置の温度の総和を最大化




この問題が务モジュラ関数であるとして最適化
異方性拡散の务モジュラ性に関する定理
u(x,t;S):熱源の配置Sに触れている時の位置x,
  時刻tの温度について,下式が成り立つ




この定理を発見したが本文には余白が狭過ぎ
  て書ききれない・・・orz
(Supplemental Materialに証明が載っています)
务モジュラ関数の最適解のGreedy
  Alogorithmによる近似に関する定理

集合関数uが务モジュラ関数ならば,Greedy
 Algorithmによって最適解の近似が得られる

“An Analysis of Approximations for Maximizing Submodular Set
   Functions.”
G. L. Nemhauser, L. A. Wolsey, and M. L. Fisher.
Math. Prog., 14:265–294, 1978.
例:Diversity ranking and Clustering
1)システムΩはグラフ,g={V,E}
2)定常状態のみを考慮
3)拡散率はエッジが張ってる頂点へはガウス
 関数,そうでない頂点は0
4)ノードxにおける熱の消失z_xは定数(0とする)
→          Greedy algorithmで解ける
              (ゲインが最大のものを順に追加)
Agenda
•   はじめに
•   务モジュラ性と拡散
•   大規模Cosegmentation(CoSand)
•   実験
•   まとめ
CoSandアルゴリズム
入力:
-画像内グラフ{G_i}
-セグメント数K
-クラスタ中心候補
 点数|L|

出力:
-クラスタ中心集合S_i
-セグメンテーションさ
 れた画像集合
画像内グラフの作成
エッジ情報を保持したSuperpixelをグラフの頂点に対応付け
         http://ttic.uchicago.edu/~xren/research/superpixel/ より




                                            この1つ1つがSuperpixel


g i  (i ,  i , Di )
              エッジ( i に隣接する  j )
i :     i :           Di : 特徴
      頂点
Gi : g i の隣接行列
CoSandアルゴリズム
入力:
-画像内グラフ{G_i}
-セグメント数K
-評価を行う点数|L|

出力:
-クラスタ中心集合S_i
-セグメンテーションさ
 れた画像集合
初期化処理
1. 画像iのクラスタ中心集合を空集合に
2. 画像iのクラスタ中心候補点集合L_i(|L|点)を
   凝集型クラスタリングによって抽出

      入力          凝集型クラスタリング後




  黒枠:Superpixel 色付きのSuperpixel:候補点
CoSandアルゴリズム
入力:
-画像内グラフ{G_i}
-セグメント数K
-評価を行う点数|L|

出力:
-クラスタ中心集合S_i
-セグメンテーションさ
 れた画像集合
CoSandアルゴリズム
BPにより複数画像間
でエネルギー最大化
CoSandアルゴリズム
最適セグメントの選択
Agenda
•   はじめに
•   务モジュラ性と拡散
•   大規模Cosegmentation
•   実験
•   まとめ
評価実験
    2種類の実験による評価
1)画像ペアに対する前景―背景のコセグメンテー
 ション性能の評価実験

2)スケーラビリティの評価実験
前景ー背景の画像ペアの
 コーセグメンテーション性能の比較実験
-MSRCデータセットから100ペアの画像を利用
-Hochbaumら(ICCV’09)Julinら(CVPR’10)と 性能を比較

※提案法はK=8でCoSand後
 Normalized-Cutで前景背
 景を決定

処理時間は1ペア10s以下

       速度,正確さ共に従来法をしのぐ結果に
スケーラビリティの評価実験
-ImageNetから50カテゴリ,1000枚ずつ画像を取得

-バウンディングボックスでセグメンテーション
 性能を評価 ※ラベル付けしんどいので

-MNcut(K=2)とLDA(トピック数2-8でベストなもの)と
 性能を比較

-ImageNetはカテゴリ内で多様過ぎるのでDiversity
 Rankingにより予め100個に画像集合をクラスタリング
 してからコーセグメンテーションをそれぞれ適用
実験結果




精度: 従来法より平均10%以上性能が改善
 処理時間
  従来法:30枚で4-9h([14]の著者によると)
  提案法:1000枚で1時間(並列化なしで)
結果例
それぞれのカテゴリは20-60枚の画像で
コーセグメンテーションされている
提案法の考察
• 画像内の複数のインスタンスをセグメンテーショ
  ン可能
• セグメンテーション結果がKに関してロバスト




(上:入力ペア 中:CoSand結果(K=8) 下:前景)
Agenda
•   はじめに
•   务モジュラ性と拡散
•   大規模Cosegmentation
•   実験
•   まとめ
まとめ
• 線形異方性拡散モデルのもとでのシステム
  の温度は务モジュラであることを証明

• Greedy-Algorithmによる温度の最大化法の
  提案

• Diversity Rankingや画像のセグメンテーション,
  コーセグメンテーションへ適用
参考資料等
• プロジェクトのページ(コード等)
 http://www.cs.cmu.edu/~gunhee/r_seg_submod.html



• 機械学習における务モジュラ性の利用
  (阪大 河原先生)
http://www.nec.co.jp/rd/datamining/project/nec_datamining_seminar8.pdf

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Graph Convolutional Network 概説
Graph Convolutional Network 概説Graph Convolutional Network 概説
Graph Convolutional Network 概説
 
Learning to Resize Images for Computer Vision Tasks
Learning to Resize Images for Computer Vision TasksLearning to Resize Images for Computer Vision Tasks
Learning to Resize Images for Computer Vision Tasks
 
Bert for multimodal
Bert for multimodalBert for multimodal
Bert for multimodal
 
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
 
(文献紹介)Depth Completionの最新動向
(文献紹介)Depth Completionの最新動向(文献紹介)Depth Completionの最新動向
(文献紹介)Depth Completionの最新動向
 
Fisher Vectorによる画像認識
Fisher Vectorによる画像認識Fisher Vectorによる画像認識
Fisher Vectorによる画像認識
 
CNN-SLAMざっくり
CNN-SLAMざっくりCNN-SLAMざっくり
CNN-SLAMざっくり
 
実践に向けたドメイン駆動設計のエッセンス
実践に向けたドメイン駆動設計のエッセンス実践に向けたドメイン駆動設計のエッセンス
実践に向けたドメイン駆動設計のエッセンス
 
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
 
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
 
SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
Cvpr 2021 manydepth
Cvpr 2021 manydepthCvpr 2021 manydepth
Cvpr 2021 manydepth
 
Self training with noisy student
Self training with noisy studentSelf training with noisy student
Self training with noisy student
 
Attention-Guided GANについて
Attention-Guided GANについてAttention-Guided GANについて
Attention-Guided GANについて
 
20190313_SDGsや社会課題にxRはどう活かせるか
20190313_SDGsや社会課題にxRはどう活かせるか20190313_SDGsや社会課題にxRはどう活かせるか
20190313_SDGsや社会課題にxRはどう活かせるか
 
LiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせLiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせ
 
チームメイトのためにdocstringを書こう! pyconjp2019
チームメイトのためにdocstringを書こう! pyconjp2019チームメイトのためにdocstringを書こう! pyconjp2019
チームメイトのためにdocstringを書こう! pyconjp2019
 
Newman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリングNewman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリング
 
[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
 
StyleGAN解説 CVPR2019読み会@DeNA
StyleGAN解説 CVPR2019読み会@DeNAStyleGAN解説 CVPR2019読み会@DeNA
StyleGAN解説 CVPR2019読み会@DeNA
 

Semelhante a 第13回関西CVPRML勉強会発表資料

大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム
Takuya Akiba
 
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
kanejaki
 

Semelhante a 第13回関西CVPRML勉強会発表資料 (20)

Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
Learning Spatial Common Sense with Geometry-Aware Recurrent NetworksLearning Spatial Common Sense with Geometry-Aware Recurrent Networks
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
 
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM) 一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
 
Matrix capsules with em routing
Matrix capsules with em routingMatrix capsules with em routing
Matrix capsules with em routing
 
大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム
 
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
 
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
 
アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法
 
Jokyokai
JokyokaiJokyokai
Jokyokai
 
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields [DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
 
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
LCCC2010:Learning on Cores,  Clusters and Cloudsの解説LCCC2010:Learning on Cores,  Clusters and Cloudsの解説
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
 
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
 
KDD2014 勉強会
KDD2014 勉強会KDD2014 勉強会
KDD2014 勉強会
 
信号処理・画像処理における凸最適化
信号処理・画像処理における凸最適化信号処理・画像処理における凸最適化
信号処理・画像処理における凸最適化
 
170614 iclr reading-public
170614 iclr reading-public170614 iclr reading-public
170614 iclr reading-public
 
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
 
Objectnessとその周辺技術
Objectnessとその周辺技術Objectnessとその周辺技術
Objectnessとその周辺技術
 
MIRU2016 チュートリアル
MIRU2016 チュートリアルMIRU2016 チュートリアル
MIRU2016 チュートリアル
 
2012-03-08 MSS研究会
2012-03-08 MSS研究会2012-03-08 MSS研究会
2012-03-08 MSS研究会
 
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
 
第126回 ロボット工学セミナー 三次元点群と深層学習
第126回 ロボット工学セミナー 三次元点群と深層学習第126回 ロボット工学セミナー 三次元点群と深層学習
第126回 ロボット工学セミナー 三次元点群と深層学習
 

第13回関西CVPRML勉強会発表資料