SlideShare uma empresa Scribd logo
1 de 14
Baixar para ler offline
CVPR 2020の動向・気付き・メタサーベイ 

1
a2kiti, hirotaka hiraki

Group 13: Face, Gesture, and Body Pose
2
人物姿勢推定について

• 人物姿勢推定とは

– 画像やビデオに映る人物について、キーポイント(関節)や形状を推
定する問題

– 主な推定対象は

• 関節の2次元座標(2DPose)

• 関節の3次元座標(3DPose)

• 全身の形状(3DShape)

3
CVPR2020の投稿論文

• 31件が採択されており半分がShape推定関連

アブストから作成したワードクラウド 

ほとんどの論文が3D表現を対象に研究 

4件
 12件
 15件

4
強い研究機関

Max Planck Institute 7件











Google 3件





Hong Kong University 3件



- EventCap: Monocular 3D Capture of High-Speed Human Motions Using an Event Cam
- DeepCap: Monocular Human Performance Capture Using Weak Supervision
- VIBE: Video Inference for Human Body Pose and Shape Estimation
- TailorNet: Predicting Clothing in 3D as a Function of Human Pose, Shape and Garment Style
- Generating 3D People in Scenes Without People
- Learning to Transfer Texture From Clothing Images to 3D Humans
- Learning to Dress 3D People in Generative Clothing

- Neural Pose Transfer by Spatially Adaptive Instance Normalization
- Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image Synthesis
- GHUM & GHUML: Generative 3D Human Shape and Articulated Pose Models

- EventCap: Monocular 3D Capture of High-Speed Human Motions Using an Event Camera
- Cascaded Deep Monocular 3D Human Pose Estimation With Evolutionary Training Data
- 3D Human Mesh Regression With Dense Correspondence

5
オーラルとポスターの比較

• 新しい問題設定もしくは新しいデータセット公開をして
いるとオーラル通りやすい?

– B

• C

6
2DPose推定

• The Devil Is in the Details: Delving Into Unbiased Data Processing for
Human Pose Estimation 

– Flippingにおけるピクセルズレが精度に影響している

ことを明らかにした研究

•
• Distribution-Aware Coordinate Representation for Human Pose
Estimation 

– 一般的に使われているヒートマップの取り扱いについて

体系的に調査した研究





所感

・2D推定の精度が3D推定に大きな影響を与える場合も多いので、

 今後も2D推定の高精度化は重要。

・上記研究のように当たり前に使われている処理を再考するのも○



7
3DPose推定

• 3DPose推定の課題

– 3次元座標は人手によるアノテーションが難しいため、モーキャプが利
用できる室内のデータが多く多様性のあるデータセット収集が困難

– 弱教師あり学習や自己教師学習、Data augmentationに関する研究が
進展

3DPose推定において標準的に使用されるHuman3.6Mデータセット

(スタジオ撮影)

8
3DPose推定

• Cascaded Deep Monocular 3D Human Pose Estimation With
Evolutionary Training Data

– 遺伝的アルゴリズムのような方法でData augmentation
• Self-Supervised 3D Human Pose Estimation via Part Guided Novel
Image Synthesis 

– アノテーションのないYoutube動画を学習に利用

Weakly-Supervised 3D Human Pose Learning via Multi-View
Images in the Wild

– マネキンチャレンジデータセットを学習に利用

所感

・データセットを拡張するためにある程度人手で適した動画を選んで与える

 必要がある。全Youtube動画から目的に合わせて必要な画像/動画を自動

 的に抽出してくるような学習が出来れば面白い。

 (もうある?)

9
Shape推定

• Shape推定におけるパラメトリックモデル

– 採択されたほとんどのShape推定研究がSMPL(Skinned Multi-Person Linear
Model)を利用(2015年論文)

– PCAにより抽出された10個のパラメータで形状を表現



• GHUM & GHUML: Generative 3D Human Shape and
Articulated Pose Model

– Googleの出した新しいパラメトリックモデル

– PCAではなくVAEでパラメータ抽出

– 顔の表情や手の形まで再現

– 今後の研究のスタンダードになる?



10
Shape推定

• Object-Occluded Human Shape and Pose Estimation From a Single
Color Image

– オクルージョンの多い環境で推定するためのモデルとデータセット作成

• EventCap: Monocular 3D Capture of High-Speed Human Motions
Using an Event Camera

– イベントカメラを用いたモデルとデータセット作成

• Bodies at Rest: 3D Human Pose and Shape Estimation From a
Pressure Image Using Synthetic Data

– ベッドで使われる圧力マット画像に対するモデルとデータセット作成

所感

・上記の研究は新しい問題設定とデータセット公開しておりオーラルに通っ

 ている。

・労力は必要だが採択への一つの近道?



• Gestureの概要
– CVPR2020では12件採択されている。
– Oral 3件、Poster 9件。
– 中国の研究チームが多い(7件)。
• テーマ
– 手のジェスチャー認識からモーション推定、人物再同定や歩行軌跡の予測
など対象は広い。


Gesture

Hand Gesture Recognition Human Trajectory Prediction
GestureでもBodyPose同様、新たな問題設定やデータセットに取り組んで
いるものがオーラルに採択されやすい

– Dongxu Liらは、手話認識においてデータセットが少なく精度が低いという
課題を転移学習で解決している。

– Hao Sunらは、時系列データにおいて動きの前後を互いに推定する手法で
ある、Reciprocal Learningを提案しState-of-The-Artを達成している。

オーラルとポスターの比較

Reciprocal Learning
Gestureの傾向

一括りにされていたデータを分割して表現

– 精度を向上させるため、従来は捨象されていた関係性や意味に着
目

• 人の動作における対象物との文脈を考慮したモーション推定(Enric
Corona et al)
• 人物同士のインタラクションを考慮した三次元再構成(Mihai Fieraru et
al)
• 人と周辺環境の関係性に注目した人物再同定(Guan’an Wang et al)
– 所感

• 文脈や関係性を考慮することで、人物の撮影が不十分なより現実的な
データへの精度が向上していくと考えられる


14
まとめ

• 

・人物姿勢推定とGesture推定について 

 CVPR2020採択論文をサーベイ。

・既に様々な手法の研究がされているが、

 実用を考えるとまだまだ精度が十分とは

 言えない。

・需要は大きいタスクなので今後も精度が

 上がれば採択されるはず。


Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

【CVPR 2020 メタサーベイ】Image Retrieval
【CVPR 2020 メタサーベイ】Image Retrieval【CVPR 2020 メタサーベイ】Image Retrieval
【CVPR 2020 メタサーベイ】Image Retrieval
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
ICCV2019 report
ICCV2019 reportICCV2019 report
ICCV2019 report
 
Cross-modality meta-survey of dataset
Cross-modality meta-survey of datasetCross-modality meta-survey of dataset
Cross-modality meta-survey of dataset
 
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under UncertaintyNeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
 
動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )
 
MIRU2018 tutorial
MIRU2018 tutorialMIRU2018 tutorial
MIRU2018 tutorial
 
miyamori m
miyamori mmiyamori m
miyamori m
 
Geotag Data Mining (メタサーベイ )
Geotag Data Mining (メタサーベイ )Geotag Data Mining (メタサーベイ )
Geotag Data Mining (メタサーベイ )
 
【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識
 
Deep learningの概要とドメインモデルの変遷
Deep learningの概要とドメインモデルの変遷Deep learningの概要とドメインモデルの変遷
Deep learningの概要とドメインモデルの変遷
 
20190804_icml_kyoto
20190804_icml_kyoto20190804_icml_kyoto
20190804_icml_kyoto
 
動画認識における代表的なモデル・データセット(メタサーベイ)
動画認識における代表的なモデル・データセット(メタサーベイ)動画認識における代表的なモデル・データセット(メタサーベイ)
動画認識における代表的なモデル・データセット(メタサーベイ)
 
【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems
 
CVPR 2018 速報とその後 (CVPR 2018 完全読破チャレンジ報告会)
CVPR 2018 速報とその後 (CVPR 2018 完全読破チャレンジ報告会) CVPR 2018 速報とその後 (CVPR 2018 完全読破チャレンジ報告会)
CVPR 2018 速報とその後 (CVPR 2018 完全読破チャレンジ報告会)
 
メタスタディ (Vision and Language)
メタスタディ (Vision and Language)メタスタディ (Vision and Language)
メタスタディ (Vision and Language)
 
効率的学習 / Efficient Training(メタサーベイ)
効率的学習 / Efficient Training(メタサーベイ)効率的学習 / Efficient Training(メタサーベイ)
効率的学習 / Efficient Training(メタサーベイ)
 
ECCV2020 オーラル論文完全読破 (2/2)
ECCV2020 オーラル論文完全読破 (2/2) ECCV2020 オーラル論文完全読破 (2/2)
ECCV2020 オーラル論文完全読破 (2/2)
 
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
 

Semelhante a 【メタサーベイ】Face, Gesture, and Body Pose

Semelhante a 【メタサーベイ】Face, Gesture, and Body Pose (20)

これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
 
[DL輪読会]Human Pose Estimation @ ECCV2018
[DL輪読会]Human Pose Estimation @ ECCV2018[DL輪読会]Human Pose Estimation @ ECCV2018
[DL輪読会]Human Pose Estimation @ ECCV2018
 
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
Learning Spatial Common Sense with Geometry-Aware Recurrent NetworksLearning Spatial Common Sense with Geometry-Aware Recurrent Networks
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
 
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
 
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
[DL輪読会]3D Human Pose Estimation @ CVPR’19 / ICCV’19
[DL輪読会]3D Human Pose Estimation @ CVPR’19 / ICCV’19[DL輪読会]3D Human Pose Estimation @ CVPR’19 / ICCV’19
[DL輪読会]3D Human Pose Estimation @ CVPR’19 / ICCV’19
 
Eccv2018 report day2
Eccv2018 report day2Eccv2018 report day2
Eccv2018 report day2
 
おしゃスタat銀座
おしゃスタat銀座おしゃスタat銀座
おしゃスタat銀座
 
cvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakicvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezaki
 
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
 
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
 
HoloGAN: Unsupervised Learning of 3D Representations from Natural Images
HoloGAN: Unsupervised Learning of 3D Representations from Natural ImagesHoloGAN: Unsupervised Learning of 3D Representations from Natural Images
HoloGAN: Unsupervised Learning of 3D Representations from Natural Images
 
先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ
 
【ECCV 2018】Implicit 3D Orientation Learning for 6D Object Detection from RGB ...
【ECCV 2018】Implicit 3D Orientation Learning for 6D Object Detection from RGB ...【ECCV 2018】Implicit 3D Orientation Learning for 6D Object Detection from RGB ...
【ECCV 2018】Implicit 3D Orientation Learning for 6D Object Detection from RGB ...
 
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
Soft Rasterizer: A Differentiable Renderer for Image-based 3D ReasoningSoft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
 
順序データでもベイズモデリング
順序データでもベイズモデリング順序データでもベイズモデリング
順序データでもベイズモデリング
 
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
 
[DL輪読会]Deep Face Recognition: A Survey
[DL輪読会]Deep Face Recognition: A Survey[DL輪読会]Deep Face Recognition: A Survey
[DL輪読会]Deep Face Recognition: A Survey
 
論文 Solo Advent Calendar
論文 Solo Advent Calendar論文 Solo Advent Calendar
論文 Solo Advent Calendar
 

Último

Último (7)

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

【メタサーベイ】Face, Gesture, and Body Pose