文献紹介：Unsupervised Domain Adaptation for Spatio-Temporal Action Localization

•

0 gostou•46 visualizações

Nakul Agarwal, Yi-Ting Chen, Behzad Dariush and Ming-Hsuan Yang, "Unsupervised Domain Adaptation for Spatio-Temporal Action Localization", BMVC2020 https://www.bmvc2020-conference.com/assets/papers/0166.pdf https://www.bmvc2020-conference.com/programme/accepted-papers/

Tecnologia

Unsupervised Domain
Adaptation for Spatio-Temporal
Action Localization
Nakul Agrawal, Yi-Ting Chen,
Behzad Dariush, Ming-Husan Yang
BMVC2020
大見一樹（名工大）
2022/10/28

概要
nSpatio-temporal action localization (STAL) の教師なしドメイン適応
• 著者によるとSTALに教師なしドメイン適応を用いた最初の研究
nSTALに有効な3つのドメイン適応モジュールの提案
!"#$%&'()*(+,+-./01.2234+56667879:

ドメイン適応
ソースターゲット
教師なし
ドメイン適応
ラベル
なしソースドメイン!"#の情報を使用して
ターゲットドメイン（$）におけるタスクを解く
ラベルがない（少ない）$の特徴量を
ラベルがある"の特徴量に近づけることで
$の適切な特徴量を獲得する
ドメイン適応とは
ドメインとは
あるデータが持つ特有の傾向
今回の場合はデータの収集元が異なる
ラベル
あり

手法の概要
キーフレームで
ドメイン適応
画像レベルで
ドメイン適応
インスタンスレベルで
ドメイン適応

モデルのベース
キーフレームで
ドメイン適応
画像レベルで
ドメイン適応
インスタンスレベルで
ドメイン適応
領域検出
任意のサイズの検出領域を
固定サイズにプーリング
検出対象のフレームである
Key frameが入力される
Key frameが中間フレームとなる
クリップが入力される

Spatial Domain Classifier
画像レベルで
ドメイン適応
インスタンスレベルで
ドメイン適応
識別器の出力
損失
分類の難易度で重みづけ
ドメインラベル
キーフレームで
ドメイン適応
逆伝播時に
勾配の符号を反転

Temporal Domain Classifier (Image)
キーフレームで
ドメイン適応
画像レベルで
ドメイン適応
インスタンスレベルで
ドメイン適応

Temporal Domain Classifier (Instance)
キーフレームで
ドメイン適応
画像レベルで
ドメイン適応
インスタンスレベルで
ドメイン適応
識別器の出力
損失

手法の概要
画像レベルで
ドメイン適応
インスタンスレベルで
ドメイン適応
キーフレームで
ドメイン適応

実験設定
nデータセット
• UCF101-Sports [Rodriguez+, CVPR2008]
• JHMDB [Jhuang+, ICCV2013]
• UCF101 [Soomro+, arXiv2012]
nドメイン適応の設定
• UCF101-Sports → UCF101 (共通する4クラス)
• JHMDB21 → UCF101 (共通する3クラス)

実験結果
nドメイン適応モジュールを3つ使うのが有効
UCF101-Sports → UCF101の結果
ドメイン適応なし
ドメイン適応あり

実験結果
nドメイン適応モジュールを3つ使うのが有効
JHMDB → UCF101の結果
ドメイン適応なし
ドメイン適応あり

まとめ
nSpatio-temporal action localizationのドメイン適応手法を提案
• 3つのドメイン適応モジュールの有効性を実験的に示した

Recomendados

論文紹介：Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki

論文紹介：Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki

論文紹介：Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Gene...Toru Tamaki

論文紹介：Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki

論文紹介：Automated Classification of Model Errors on ImageNetToru Tamaki

論文紹介：Semantic segmentation using Vision Transformers: A surveyToru Tamaki

論文紹介：MOSE: A New Dataset for Video Object Segmentation in Complex ScenesToru Tamaki

論文紹介：MoLo: Motion-Augmented Long-Short Contrastive Learning for Few-Shot Acti...Toru Tamaki

論文紹介：Tracking Anything with Decoupled Video SegmentationToru Tamaki

論文紹介：Real-Time Evaluation in Online Continual Learning: A New HopeToru Tamaki

論文紹介：PointNet: Deep Learning on Point Sets for 3D Classification and Segmenta...Toru Tamaki

論文紹介：Multitask Vision-Language Prompt TuningToru Tamaki

論文紹介：MovieCLIP: Visual Scene Recognition in MoviesToru Tamaki

論文紹介：Discovering Universal Geometry in Embeddings with ICAToru Tamaki

論文紹介：Efficient Video Action Detection with Token Dropout and Context RefinementToru Tamaki

論文紹介：Learning from Noisy Pseudo Labels for Semi-Supervised Temporal Action Lo...Toru Tamaki

論文紹介：MeMViT: Memory-Augmented Multiscale Vision Transformer for Efficient Lon...Toru Tamaki

論文紹介：Revealing the unseen: Benchmarking video action recognition under occlusionToru Tamaki

論文紹介：Video Task Decathlon: Unifying Image and Video Tasks in Autonomous DrivingToru Tamaki

論文紹介：Spatio-Temporal Action Detection Under Large MotionToru Tamaki

論文紹介：Vision Transformer Adapter for Dense PredictionsToru Tamaki

動画像理解のための深層学習アプローチ Deep learning approaches to video understandingToru Tamaki

論文紹介：Masked Vision and Language Modeling for Multi-modal Representation LearningToru Tamaki

論文紹介：Noise-Aware Learning from Web-Crawled Image-Text Data for Image CaptioningToru Tamaki

論文紹介：ProbVLM: Probabilistic Adapter for Frozen Vison-Language ModelsToru Tamaki

論文紹介：Prompt Switch: Efficient CLIP Adaptation for Text-Video RetrievalToru Tamaki

論文紹介：Transferable Decoding with Visual Entities for Zero-Shot Image CaptioningToru Tamaki

論文紹介：Video Test-Time Adaptation for Action RecognitionToru Tamaki

Mais conteúdo relacionado

Mais de Toru Tamaki