CVPR2019読み会で発表したRethinking the Evaluation of Video Summariesの説明スライドです。論文自体は映像要約全体を分析しており、読み応えがありました。説明スライドがあっているかどうかよくわからないので、詳しくは本人に聞いてください。よろしくおねがいします。
CVPR2019読み会 (Rethinking the Evaluation of Video Summaries)
1. Rethinking the Evaluation of Video
Summaries
Mayu Otani1, Yuta Nakashima, Esa Rahtu, Janne Heikkilä
1CyberAgent, Inc. Tampere University University of Oulu
資料作成者: 尾崎安範
株式会社サイバーエージェント AI Lab
7. 既存⼿法dppLSTM[1]の説明
• LSTMを単純に使うだけではなく、 determinantal point
process (DPP) という多様な部分集合を選択するための⼿法を
使って、重要度予測の精度を上げている⼿法
• 今回のフレームワークで処理を分類すると以下の通り。
重要度予測︓ dppLSTM
映像の区間切り分け: (KTS)
映像の区間選択: (動的計画法)
[1] Ke Zhang et al., “Video Summarization with Long Short-term
Memory”
8. 映像区間を区切る⽅法であるKTSって
なんぞい
• KTS [1] (Segment video with Kernel Temporal Segmentation) と
は噛み砕いて書くと、各フレームの画像特徴量を抽出されて
いることが前提として、その画像特徴量で⼤きな変化が出て
たフレームで映像を区切る⼿法である。
[1] D. Potapov, M. Douze, Z. Harchaoui, and C. Schmid.
Category-specific video summarization. In European Conference
on Computer Vision (ECCV), pages 540–555, 2014.