SlideShare uma empresa Scribd logo
1 de 28
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
深層学習を用いたバス乗客画像の属性推定
に関する研究
A Study on Attribute Estimation of Bus
Passenger Images Using Deep Learning
北海道大学 大学院情報科学院
情報理工学部門 複合情報工学分野 調和系工学研究室
修士2年 鐘支俊
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
研究背景 2
• 乗合バス事業の経常収支率は平成27年以降悪化傾向にある[1]
• 業務・サービスの改善が求められる
– 路線計画・ダイヤの効率化
– 車内安全確保
• 移動人物,荷物の検出
• 子連れ、高齢者などの補助
➞ 優先席へ誘導する、運転手の注意を喚起
– 乗客利用状況の把握
• 通勤、通学、旅行などの利用目的の推測
➞ 路線策定、運行管理
• バス事業者が分析フェーズで活用
➞ 車内デザイン、車内広告の効果を高める
• 乗客の属性情報がサービスの改善において重要
– 車内安全確保
➞ 乗客の把握には子連れ、高齢者、乳幼児などの属性情報が必要
– 乗客利用状況の把握
➞ 学生、旅行者などの属性情報が有用
平成27年~令和2年
[1] 日本のバス事業,日本バス協会, 2021年度版(令和3年度), https://www.bus.or.jp/about/pdf/2021_busjigyo.pdf
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
各種サービスに必要なデータの収集について 3
• 路線計画,ダイヤの効率化 ➞ 乗客OD(Origin-Destination)データ
• 車内安全確保、乗客利用情報 ➞ 乗客の属性情報
• 従来のデータ収集方法
– ICカード:
• データ取得に追加料金が必要
• 全員が利用してるわけではない
– SAPICA記名カードの発行枚数は約全体の6割[2]
– 調査員の派遣:
• 人手が必要で高コスト
バス車内にカメラを設置
事業者のみでも実施可能
本研究の対象:
 乗降する人物の一連の画像に対して属性推定を行う
• 女性
• 70s
...
乗車: ...
降車:
[2]サピカ、新たに図書貸出券機能 札幌市内40カ所で利用可能へ”. 北海道新聞, https://www.hokkaido-np.co.jp/news/sapporo/554686.html.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
4
研究目的
• 深層学習を用いた属性推定手法の提案
– バス乗客の性別、年代、持ち物属性を推定
– 応用可能な精度(85%)を達成
• 本発表の内容
– 人物追跡手法により同一人物の画像を取得
– 人物属性推定器Swin Transformerを用いた属性推定
手法の提案
– 検証データによる評価と比較
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
5
乗客属性推定の流れ
想定するシステム
バス停毎に乗車・降車の
映像を撮影
顔検出と
モザイク処理
人物
検出器
人物
追跡器
車内画像データ
処理済み
画像
同一人物
画像
人物
矩形 属性
推定器
• 女性
• 30-40s
本研究
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
6
属性定義
• 選定理由:
– バス事業者のニーズ
• 車内デザイン、車内広告の効果を高める
– 実応用に役に立つ
• 乗客の利用目的の推定(通学)
• 助けが必要な乗客の把握(高齢者、子連れ、旅行者)
• 女性
• 男性
性別
• 0-5
• 6-19
• 20s
• 30-40s
• 50-60s
• 70~
年代
• 学生
• 子連れ
• 旅行者(スーツケースを持つ)
その他
0-5 6-19 20s 30-40s 50-60s 70s
学生 子連れ 旅行者
女性 男性
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
7
データの収集
データ
セット
撮影時期 画像数 人物数
人物ごと
の画像数
補足
①
2021-11
& 2022-01
3,198 527 1~20
実験1用
(交差検証)
② 2022-01 697 25 8~53
実験2用
(モデルの評価)
• 収集したデータセット
① :交差検証実験でモデルを学習させる
② :交差検証実験で得たモデルを評価
• 撮影環境:
• バス:実際に札幌市内を走行する路線バス
• 時間帯:12:30-17:30
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
8
バス乗客画像を用いた属性推定の難しさ
• 画像特徴
• アノテーション
 属性真値を取得するのは難しいため個人による目視でアノテーション
 画像から判断するため誤差を含む
• データセット分布
 属性ごとの画像分布は不均衡
 0-5、子連れと旅行者の画像数は非常に少ない
 地域や路線によるデータの分布と特徴が異なる
人物や手すりの
オクルージョン
人物の顔の
モザイク処理
太陽光による
白飛びと黒つぶれ
カメラの設置位置の
制約による画角の限界
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
9
従来研究(1/2)
• 人物属性推定
– 防犯カメラへの応用
• 服装、外見と持ち物などの属性の推定が多い[3]
– 従来の人物属性推定手法
• 色やテクスチャのヒストグラムなどの特徴量に依存[4]
• 単一の人物画像に対する属性推定手法が多い[5]
– 深層学習の導入
• 人物属性推定の手法ALMが高いパフォーマンスを発揮[6]
• Swin Transformer
– CVのバックボーンとして高い性能を実現
– 分類タスクでSOTAを達成[7]
• 本研究ではバスで撮った同一人物の複数の画像に対して、
属性推定を行う
[3] Dangwei Li, Xiaotang Chen, and Kaiqi Huang. Multi-attribute learning for pedestrian attribute recognition in surveillance scenarios. In2015 3rd IAPR Asian Conference on Pattern Recognition
(ACPR), pages 111–115. IEEE, 2015
[4] Yubin Deng, Ping Luo, Chen Change Loy, and Xiaoou Tang. Pedestrian attribute recognition at far distance. In Proceedings of the 22nd ACM international conference on Multimedia, pages 789–792,
2014.
[5] Wang, Xiao, et al. "Pedestrian attribute recognition: A survey." Pattern Recognition 121 (2022): 108220.
[6] Chufeng Tang, Lu Sheng, Zhaoxiang Zhang, and Xiaolin Hu. Improving pedestrian attribute recognition with weakly-supervised multiscale attribute-specific localization. In Proceedings of the
IEEE/CVF International Conference on Computer Vision (ICCV), October 2019
[7] Ze Liu, Yutong Lin, Yue Cao, Han Hu, Yixuan Wei, Zheng Zhang, Stephen Lin, and Baining Guo. Swin transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the
IEEE/CVF International Conference on Computer Vision, pages 10012–10022, 2021
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
10
従来研究(2/2)
• 従来の属性推定の精度[8]
データ
セット
属性数 主な属性 画像数 人物数
SOTA
(%)
特徴
PETA [9] 65 年代、服装、
持ち物、髪型
19,000 8,705 83.96 オクルージョンなし
RAP2.0 [10] 72 ジェスチャー、服装、
髪型、持ち物
84,928 26,638 78.25 オクルージョンあり
PA100k [11] 26 服装、持ち物、
性別、人物向き
100,000 18,206 80.21 オクルージョンなし
本研究 11 年代、性別、
学生、旅行者、子連れ
3,895 552 - 人物の顔にモザイク処理、
車内の明るさの変化、
オクルージョン(人、ドア、手すり)
[8] ia, J., Huang, H., Chen, X. and Huang, K.: Rethinking of pedestrian attribute recognition: A reliable evaluation under zero-shot pedestrian identitysetting, arXiv preprint
arXiv:2107.03576 (2021)
[9] Y. Deng, P. Luo, C. C. Loy, X. Tang, "Pedestrian attribute recognition at far distance," in Proceedings of ACM Multimedia (ACM MM), 2014.
[10] Li, Dangwei, et al. "A richly annotated pedestrian dataset for person retrieval in real surveillance scenarios." IEEE transactions on image processing 28.4 (2018): 1575-
1590.
PETA の画像例 RAP2.0 の画像例 PA100k の画像例 本研究の画像例
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
11
属性推定器
• 入力画像の前処理
 平坦化処理、ガンマ補正、データ拡張手法を適用
 画像の特徴問題対応には有効であることを予備実験で検証済み
• 属性の出力
 分類の中で信頼度が最も高い属性を出力
 属性の二重付与問題に対応
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
12
推定モデル
1. Swin Transformer による3つの特徴マップを抽出
 属性推定はmulti-class分類タスク
 Swin Transformerはmulti-classタスクにおいて高い精度を実現
2. 抽出した特徴をALMに入力、属性ごとの信頼度を出力
 ALMは属性推定タスクで SOTA を達成
3. ALMの出力とSwin Transformerの出力を統合
4. 同じ分類の中で信頼度が最も高い属性を出力
信頼度が
最も高い
属性
1
2
3
4
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
13
閾値で最終的な属性を決定
 閾値で最終的な属性を決定する:
検出したフレーム数
トータルフレーム数
≥ 閾値𝑎𝑡𝑡𝑟𝑖𝑏𝑢𝑡𝑒
 性別と年代クラス中で値が最も高い属性を出力
女性
30s
女性
30s
旅行者
女性
20s
女性
20s
学生
女性
30s
女性
20s
学生
• 女性: 1.00
• 30s: 0.67
• 20s: 0.33
• 旅行者: 0.33
• 女性: 1.00
• 20s: 0.67
• 30s: 0.33
• 学生: 0.67
④
• 女性
• 30s
• 女性
• 20s
• 学生
>= 0.5
>= 0.5
 閾値を用いずに尤度の合計から属性判定をする手法もあるが、実験結果を分
析する必要があるために各人に対して閾値で属性を決定
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
14
実験設定
• 実験設定:
– 学習GPU:
• GeForce GTX TITAN X * 4
– ImageNet-1K[12]データセットでSwin Transformerを事前学習
• 精度が最も高いバージョンSwin Lを使用
• 実環境への第一段階であるため,推論時間より精度の方が重要
– パラメータ設定:
• 評価指標:
– BA (Balanced Accuracy) = (
𝑇𝑃
𝑇𝑃+𝐹𝑁
+
𝑇𝑁
𝐹𝑃+𝑇𝑁
) ×
1
2
Parameter Setting
Input size 384×384
Epoch 60
Batch size 8
Optimizer Adam
Learning rate 0.0001
[12] Deng, J., Dong, W., Socher, R., Li, L.-J., Li, K. and Fei-Fei, L.: Imagenet: A large-scale hierarchical image database, 2009 IEEE conference on computer vision and
pattern recognition, Ieee, pp.248–255 (2009).
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
15
実験1:交差検証 (1/3)
• データセット①
• 学習方法:Group K-Fold + Stratified K-Fold
– 人物IDと属性比率によって五個のFoldを分けて学習
– 各Foldのtrainとtestで属性の分布を同じにする
– 通常のKFold手法より効果がある
• 各Foldの実験結果比較:
– Fold-0はベストモデル
データ
セット
撮影時期 画像数 人物数
人物ごと
の画像数
補足
①
2021-11
& 2022-01
3,198 527 1~20
実験1用
(交差検証)
Fold BA
Fold-0 0.730
Fold-1 0.669
Fold-2 0.698
Fold-3 0.706
Fold-4 0.705
平均 0.707
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
16
実験1:交差検証 (2/3)
• 閾値を決める実験
– 前述の実験では属性ごとに閾値一律0.5として設定
– 閾値は0~1の範囲で0.01ずつ変化させて検証実験を実施
– BAが最も高い時の閾値を採用
– 最適な閾値を適用することで、属性推定の結果が5.6%上昇
クラス 属性
BA
Threshold = 0.5
BA 閾値
性別
女性 0.844 0.859 0.55
男性 0.837 0.847 0.57
年代
0-5 0.850 0.960 0.08
6-19 0.792 0.812 0.39
20s 0.673 0.685 0.12
30-40s 0.615 0.663 0.09
50-60s 0.639 0.688 0.31
70~ 0.836 0.850 0.08
その他
学生 0.772 0.775 0.59
子連れ 0.562 0.688 0.21
旅行者 0.497 0.710 0.13
平均 0.720 0.776
最適
閾値
閾値による属性ごとの精度の変化
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
17
実験1:交差検証 (3/3)
• 全画像と人物ごとの比較実験
– 全画像:単一の人物画像に対して評価
– 人物ごと:同一人物の複数画像に対して評価
• 同一人物の複数画像を使うことで、BAが6.9%向上
– 各属性のBAが上昇
– 旅行者と子連れの検出は大幅に改善
– 20s~60s年代属性の精度の向上は比較的低い
クラス 属性 全画像 人物ごと
性別
女性 0.795 0.859
男性 0.793 0.847
年代
0-5 0.862 0.960
6-19 0.747 0.812
20s 0.651 0.685
30-40s 0.638 0.663
50-60s 0.611 0.688
70~ 0.785 0.850
その他
学生 0.739 0.775
子連れ 0.575 0.688
旅行者 0.580 0.710
平均 0.707 0.776
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
18
実験2:データセット②での検証結果 (1/4)
• 実験2設定:
– データセット②
– 実験1で得た最適閾値を適用
– 実験1で得たFold-0のモデルを使用
• 人物ごとで平均精度が3%上昇
– 男性、0-19、70~の属性推定精度が大幅向上
– 女性、20s-60s、学生の属性精度少し低下
– 子連れと旅行者の精度はほぼ変化なし
クラス 属性 全画像 人物ごと
性別
女性 0.799 0.783
男性 0.694 0.783
年代
0-5 0.991 1.000
6-19 0.772 0.925
20s 0.602 0.549
30-40s 0.708 0.697
50-60s 0.535 0.500
70~ 0.731 0.935
その他
学生 0.730 0.711
子連れ 0.994 1.000
旅行者 0.499 0.500
平均 0.732 0.762
データセット 撮影時期 画像数 人物数
人物ごと
の画像数
補足
② 2022-01 697 25 8~53 テスト実験でのみ使う
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
19
実験2:データセット②での検証結果 (2/4)
• 年代クラスの結果(画像ごと)
– 697枚画像
– 年代の誤分類幅のばらつきが大きい
• 20sと50-60sの年代分類は一個ずれている画像が多い
年代属性ごとの誤分類幅と画像数
年代属性の混同行列結果
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
20
年代の誤推定の画像例
FP: 0-5 GT: 70~
全身にモザイク
FP: 0-5 GT: 20s
黒つぶれかつ
上半身が乗客と
オクルージョン
FP: 70~ GT: 50-60s
黒つぶれ
(画像ピクセルのヒスト
グラムが左に偏っている)
FP: 30-40s GT: 50-60s
後ろ姿により人目にも
判別しにくい
FP: 70~ GT: 20s
全身にモザイクかつ
オクルージョン
FP: False Positive
GT: Ground Truth
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
21
実験2:データセット②での検証結果 (3/4)
• 年代クラスの結果(人物ごと)
– 25人中14人を誤推定
– 20sと50-60sの分類結果は一個ずれている例が多い
– 画像ごとの結果と比べ、年代が大幅にずれている例が減少
年代属性ごとの誤分類幅と人数
年代属性の混同行列結果
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
22
実験2:データセット②での検証結果 (4/4)
• 他のクラスの結果
– 性別
• 25人中4人を誤推定
– 学生:
• 25人中7人を誤推定
– 子連れ:
• データセットに含まない
– 旅行者:
• 検出できなかった
クラス 属性 TN FP FN TP
性別
女性 16 1 3 5
男性 5 3 1 16
その他
学生 11 3 4 7
子連れ 25 0 0 0
旅行者 24 0 1 0
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
23
実験2:結果例(1/3)
• 間違った結果例
• 女性
• 20s
乗車画像には黒つぶれが多くかつ
降車画像にスーツケースが映らなかった
ことが原因で年代と旅行者を誤推定
• 男性
• 30-40s
乗車画像には黒つぶれが多くかつ
降車画像でのモザイク処理と服装が
原因で性別と年代の誤推定
GT:
• 女性
• 30-40s
• 旅行者
GT:
• 女性
• 50-60s
推定:
推定:
...
...
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
24
実験2:結果例(2/3)
• 間違った結果例
• 男性
• 30-40s
• 学生
乗車画像でのモザイク処理かつ
コートとカバンの色が近いことが
原因で年代の誤推定
降車画像の明るさが要因で服装
が変わって見える問題と髪型が
原因で性別と学生の誤推定
• 男性
• 70~
GT:
• 男性
• 20s
GT:
• 女性
• 30-40s
推定:
推定:
...
...
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
25
実験2:結果例(3/3)
• 正しく推定できた例
– 一部のフレームで誤推定が出たが、最終的な結果は正しい
• 女性
• 30-40s
• 女性
• 20s
• 学生
フレーム数:35
属性 検出した数
女性 19
男性 16
0-5 1
6-19 12
20s 21
30-40s 1
学生 23
フレーム数:47
属性 検出した数
女性 30
男性 17
6-19 1
20s 12
30-40s 29
70s 5
学生 4
...
...
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
26
学習画像数による精度の変化を検証
• 画像数が多い属性に対して、学習に用いられる画像数を減ら
して、精度の変化を検証
 学習画像を減らしたら、精度の低下が見られた
 学生と20s属性の精度が大幅に下がった
 画像数を増やせば更なる精度向上が期待できる
属性を持つ画像数による属性の精度の変化
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
27
まとめ
• Swin Transformerを用いたバス乗客の属性推定アルゴリズムを提案
し,その検証を行った
• 検証のために実際に運行する路線バスの乗降口にカメラを
設置して撮影およびアノテーションを行いデータセットを
作成した
• 同一人物の複数画像で属性推定器の精度の向上が確認でき、
性別、0-5、6-19、70~の属性において十分な精度を達成した
• 属性推定器の誤検知を考察し、特に明るさ、モザイク処理とオク
ルージョンの要因により誤検知しやすいことを確かめた
• 実環境への第一段階として、バス乗客属性推定の実用性を示した
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
28
研究業績
• 国内学会発表2回
– 鐘 支俊, 横山 想一郎, 山下 倫央, 川村 秀憲, 佐藤 好美, 長谷川 怜, 平澤 幸:Swin
Transformer を用いたバス乗客属性の推定, 第21回複雑系マイクロシンポジウム, 9,
オンライン(2022)
– Zhijun Zhong, Soichiro Yokoyama, Tomohisa Yamashita, Hidenori Kawamura,
Yoshimi Sato, Rei Hasegawa, Miyuki Hirasawa : Attribute Estimation of Bus
Passenger Using MPNTrack and Swin Transformer, Workshop of Social System
and Information Technology (WSSIT2023), (2023, 発表予定)
• 国際学会発表1回
– Zhijun Zhong, Soichiro Yokoyama, Tomohisa Yamashita, Hidenori Kawamura, Yoshimi
Sato, Rei Hasegawa, Miyuki Hirasawa : Estimation of Bus Passenger Attributes Using
Swin Transformer, The 5th International Conference on Artificial Intelligence and
Pattern Recognition (AIPR), Xiamen, China, September (2022)

Mais conteúdo relacionado

Mais procurados

条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習Masaki Saito
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~nlab_utokyo
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDeep Learning JP
 
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)Satoshi Hara
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detectionharmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
学位論文の書き方メモ (Tips for writing thesis)
学位論文の書き方メモ (Tips for writing thesis)学位論文の書き方メモ (Tips for writing thesis)
学位論文の書き方メモ (Tips for writing thesis)Nobuyuki Umetani
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-Yoshiharu Ikutani
 
Deep High Resolution Representation Learning for Human Pose Estimation
Deep High Resolution Representation Learning for Human Pose EstimationDeep High Resolution Representation Learning for Human Pose Estimation
Deep High Resolution Representation Learning for Human Pose Estimationharmonylab
 
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII
 
最近のディープラーニングのトレンド紹介_20200925
最近のディープラーニングのトレンド紹介_20200925最近のディープラーニングのトレンド紹介_20200925
最近のディープラーニングのトレンド紹介_20200925小川 雄太郎
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Yamato OKAMOTO
 
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向Koichiro Mori
 
【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"Deep Learning JP
 
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognitionharmonylab
 
交差点の交通流におけるシミュレーション環境 を用いた深層強化学習に関する研究
 交差点の交通流におけるシミュレーション環境   を用いた深層強化学習に関する研究 交差点の交通流におけるシミュレーション環境   を用いた深層強化学習に関する研究
交差点の交通流におけるシミュレーション環境 を用いた深層強化学習に関する研究harmonylab
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...NTT DATA Technology & Innovation
 
5 クラスタリングと異常検出
5 クラスタリングと異常検出5 クラスタリングと異常検出
5 クラスタリングと異常検出Seiichi Uchida
 

Mais procurados (20)

条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detection
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
学位論文の書き方メモ (Tips for writing thesis)
学位論文の書き方メモ (Tips for writing thesis)学位論文の書き方メモ (Tips for writing thesis)
学位論文の書き方メモ (Tips for writing thesis)
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
 
Deep High Resolution Representation Learning for Human Pose Estimation
Deep High Resolution Representation Learning for Human Pose EstimationDeep High Resolution Representation Learning for Human Pose Estimation
Deep High Resolution Representation Learning for Human Pose Estimation
 
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
 
最近のディープラーニングのトレンド紹介_20200925
最近のディープラーニングのトレンド紹介_20200925最近のディープラーニングのトレンド紹介_20200925
最近のディープラーニングのトレンド紹介_20200925
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
 
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向
 
【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"
 
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
 
交差点の交通流におけるシミュレーション環境 を用いた深層強化学習に関する研究
 交差点の交通流におけるシミュレーション環境   を用いた深層強化学習に関する研究 交差点の交通流におけるシミュレーション環境   を用いた深層強化学習に関する研究
交差点の交通流におけるシミュレーション環境 を用いた深層強化学習に関する研究
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
 
5 クラスタリングと異常検出
5 クラスタリングと異常検出5 クラスタリングと異常検出
5 クラスタリングと異常検出
 

Semelhante a 深層学習を用いたバス乗客画像の属性推定 に関する研究

Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...harmonylab
 
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究harmonylab
 
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...harmonylab
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Gridharmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic ArithmeticZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmeticharmonylab
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...harmonylab
 
Semi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture SearchSemi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture Searchharmonylab
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)harmonylab
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirataharmonylab
 
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple TasksYou Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasksharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...harmonylab
 
深層強化学習による自動運転車両の追い越し行動の実現に関する研究
深層強化学習による自動運転車両の追い越し行動の実現に関する研究深層強化学習による自動運転車両の追い越し行動の実現に関する研究
深層強化学習による自動運転車両の追い越し行動の実現に関する研究harmonylab
 
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...harmonylab
 
Inspiration through Observation: Demonstrating the Influence of Automatically...
Inspiration through Observation: Demonstrating the Influence of Automatically...Inspiration through Observation: Demonstrating the Influence of Automatically...
Inspiration through Observation: Demonstrating the Influence of Automatically...harmonylab
 

Semelhante a 深層学習を用いたバス乗客画像の属性推定 に関する研究 (20)

Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
修士論文
修士論文修士論文
修士論文
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
 
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
 
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic ArithmeticZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
 
Semi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture SearchSemi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture Search
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
 
RAPiD
RAPiDRAPiD
RAPiD
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirata
 
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple TasksYou Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasks
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
 
深層強化学習による自動運転車両の追い越し行動の実現に関する研究
深層強化学習による自動運転車両の追い越し行動の実現に関する研究深層強化学習による自動運転車両の追い越し行動の実現に関する研究
深層強化学習による自動運転車両の追い越し行動の実現に関する研究
 
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
 
Inspiration through Observation: Demonstrating the Influence of Automatically...
Inspiration through Observation: Demonstrating the Influence of Automatically...Inspiration through Observation: Demonstrating the Influence of Automatically...
Inspiration through Observation: Demonstrating the Influence of Automatically...
 

Mais de harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...harmonylab
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...harmonylab
 
Emotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANharmonylab
 
2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料harmonylab
 
CKL_about_panf2022.pdf
CKL_about_panf2022.pdfCKL_about_panf2022.pdf
CKL_about_panf2022.pdfharmonylab
 

Mais de harmonylab (18)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
 
Emotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GAN
 
2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料
 
CKL_about_panf2022.pdf
CKL_about_panf2022.pdfCKL_about_panf2022.pdf
CKL_about_panf2022.pdf
 

Último

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 

Último (8)

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 

深層学習を用いたバス乗客画像の属性推定 に関する研究

  • 1. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 深層学習を用いたバス乗客画像の属性推定 に関する研究 A Study on Attribute Estimation of Bus Passenger Images Using Deep Learning 北海道大学 大学院情報科学院 情報理工学部門 複合情報工学分野 調和系工学研究室 修士2年 鐘支俊
  • 2. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 研究背景 2 • 乗合バス事業の経常収支率は平成27年以降悪化傾向にある[1] • 業務・サービスの改善が求められる – 路線計画・ダイヤの効率化 – 車内安全確保 • 移動人物,荷物の検出 • 子連れ、高齢者などの補助 ➞ 優先席へ誘導する、運転手の注意を喚起 – 乗客利用状況の把握 • 通勤、通学、旅行などの利用目的の推測 ➞ 路線策定、運行管理 • バス事業者が分析フェーズで活用 ➞ 車内デザイン、車内広告の効果を高める • 乗客の属性情報がサービスの改善において重要 – 車内安全確保 ➞ 乗客の把握には子連れ、高齢者、乳幼児などの属性情報が必要 – 乗客利用状況の把握 ➞ 学生、旅行者などの属性情報が有用 平成27年~令和2年 [1] 日本のバス事業,日本バス協会, 2021年度版(令和3年度), https://www.bus.or.jp/about/pdf/2021_busjigyo.pdf
  • 3. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 各種サービスに必要なデータの収集について 3 • 路線計画,ダイヤの効率化 ➞ 乗客OD(Origin-Destination)データ • 車内安全確保、乗客利用情報 ➞ 乗客の属性情報 • 従来のデータ収集方法 – ICカード: • データ取得に追加料金が必要 • 全員が利用してるわけではない – SAPICA記名カードの発行枚数は約全体の6割[2] – 調査員の派遣: • 人手が必要で高コスト バス車内にカメラを設置 事業者のみでも実施可能 本研究の対象:  乗降する人物の一連の画像に対して属性推定を行う • 女性 • 70s ... 乗車: ... 降車: [2]サピカ、新たに図書貸出券機能 札幌市内40カ所で利用可能へ”. 北海道新聞, https://www.hokkaido-np.co.jp/news/sapporo/554686.html.
  • 4. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 4 研究目的 • 深層学習を用いた属性推定手法の提案 – バス乗客の性別、年代、持ち物属性を推定 – 応用可能な精度(85%)を達成 • 本発表の内容 – 人物追跡手法により同一人物の画像を取得 – 人物属性推定器Swin Transformerを用いた属性推定 手法の提案 – 検証データによる評価と比較
  • 5. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 5 乗客属性推定の流れ 想定するシステム バス停毎に乗車・降車の 映像を撮影 顔検出と モザイク処理 人物 検出器 人物 追跡器 車内画像データ 処理済み 画像 同一人物 画像 人物 矩形 属性 推定器 • 女性 • 30-40s 本研究
  • 6. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 6 属性定義 • 選定理由: – バス事業者のニーズ • 車内デザイン、車内広告の効果を高める – 実応用に役に立つ • 乗客の利用目的の推定(通学) • 助けが必要な乗客の把握(高齢者、子連れ、旅行者) • 女性 • 男性 性別 • 0-5 • 6-19 • 20s • 30-40s • 50-60s • 70~ 年代 • 学生 • 子連れ • 旅行者(スーツケースを持つ) その他 0-5 6-19 20s 30-40s 50-60s 70s 学生 子連れ 旅行者 女性 男性
  • 7. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 7 データの収集 データ セット 撮影時期 画像数 人物数 人物ごと の画像数 補足 ① 2021-11 & 2022-01 3,198 527 1~20 実験1用 (交差検証) ② 2022-01 697 25 8~53 実験2用 (モデルの評価) • 収集したデータセット ① :交差検証実験でモデルを学習させる ② :交差検証実験で得たモデルを評価 • 撮影環境: • バス:実際に札幌市内を走行する路線バス • 時間帯:12:30-17:30
  • 8. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 8 バス乗客画像を用いた属性推定の難しさ • 画像特徴 • アノテーション  属性真値を取得するのは難しいため個人による目視でアノテーション  画像から判断するため誤差を含む • データセット分布  属性ごとの画像分布は不均衡  0-5、子連れと旅行者の画像数は非常に少ない  地域や路線によるデータの分布と特徴が異なる 人物や手すりの オクルージョン 人物の顔の モザイク処理 太陽光による 白飛びと黒つぶれ カメラの設置位置の 制約による画角の限界
  • 9. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 9 従来研究(1/2) • 人物属性推定 – 防犯カメラへの応用 • 服装、外見と持ち物などの属性の推定が多い[3] – 従来の人物属性推定手法 • 色やテクスチャのヒストグラムなどの特徴量に依存[4] • 単一の人物画像に対する属性推定手法が多い[5] – 深層学習の導入 • 人物属性推定の手法ALMが高いパフォーマンスを発揮[6] • Swin Transformer – CVのバックボーンとして高い性能を実現 – 分類タスクでSOTAを達成[7] • 本研究ではバスで撮った同一人物の複数の画像に対して、 属性推定を行う [3] Dangwei Li, Xiaotang Chen, and Kaiqi Huang. Multi-attribute learning for pedestrian attribute recognition in surveillance scenarios. In2015 3rd IAPR Asian Conference on Pattern Recognition (ACPR), pages 111–115. IEEE, 2015 [4] Yubin Deng, Ping Luo, Chen Change Loy, and Xiaoou Tang. Pedestrian attribute recognition at far distance. In Proceedings of the 22nd ACM international conference on Multimedia, pages 789–792, 2014. [5] Wang, Xiao, et al. "Pedestrian attribute recognition: A survey." Pattern Recognition 121 (2022): 108220. [6] Chufeng Tang, Lu Sheng, Zhaoxiang Zhang, and Xiaolin Hu. Improving pedestrian attribute recognition with weakly-supervised multiscale attribute-specific localization. In Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), October 2019 [7] Ze Liu, Yutong Lin, Yue Cao, Han Hu, Yixuan Wei, Zheng Zhang, Stephen Lin, and Baining Guo. Swin transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision, pages 10012–10022, 2021
  • 10. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 10 従来研究(2/2) • 従来の属性推定の精度[8] データ セット 属性数 主な属性 画像数 人物数 SOTA (%) 特徴 PETA [9] 65 年代、服装、 持ち物、髪型 19,000 8,705 83.96 オクルージョンなし RAP2.0 [10] 72 ジェスチャー、服装、 髪型、持ち物 84,928 26,638 78.25 オクルージョンあり PA100k [11] 26 服装、持ち物、 性別、人物向き 100,000 18,206 80.21 オクルージョンなし 本研究 11 年代、性別、 学生、旅行者、子連れ 3,895 552 - 人物の顔にモザイク処理、 車内の明るさの変化、 オクルージョン(人、ドア、手すり) [8] ia, J., Huang, H., Chen, X. and Huang, K.: Rethinking of pedestrian attribute recognition: A reliable evaluation under zero-shot pedestrian identitysetting, arXiv preprint arXiv:2107.03576 (2021) [9] Y. Deng, P. Luo, C. C. Loy, X. Tang, "Pedestrian attribute recognition at far distance," in Proceedings of ACM Multimedia (ACM MM), 2014. [10] Li, Dangwei, et al. "A richly annotated pedestrian dataset for person retrieval in real surveillance scenarios." IEEE transactions on image processing 28.4 (2018): 1575- 1590. PETA の画像例 RAP2.0 の画像例 PA100k の画像例 本研究の画像例
  • 11. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 11 属性推定器 • 入力画像の前処理  平坦化処理、ガンマ補正、データ拡張手法を適用  画像の特徴問題対応には有効であることを予備実験で検証済み • 属性の出力  分類の中で信頼度が最も高い属性を出力  属性の二重付与問題に対応
  • 12. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 12 推定モデル 1. Swin Transformer による3つの特徴マップを抽出  属性推定はmulti-class分類タスク  Swin Transformerはmulti-classタスクにおいて高い精度を実現 2. 抽出した特徴をALMに入力、属性ごとの信頼度を出力  ALMは属性推定タスクで SOTA を達成 3. ALMの出力とSwin Transformerの出力を統合 4. 同じ分類の中で信頼度が最も高い属性を出力 信頼度が 最も高い 属性 1 2 3 4
  • 13. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 13 閾値で最終的な属性を決定  閾値で最終的な属性を決定する: 検出したフレーム数 トータルフレーム数 ≥ 閾値𝑎𝑡𝑡𝑟𝑖𝑏𝑢𝑡𝑒  性別と年代クラス中で値が最も高い属性を出力 女性 30s 女性 30s 旅行者 女性 20s 女性 20s 学生 女性 30s 女性 20s 学生 • 女性: 1.00 • 30s: 0.67 • 20s: 0.33 • 旅行者: 0.33 • 女性: 1.00 • 20s: 0.67 • 30s: 0.33 • 学生: 0.67 ④ • 女性 • 30s • 女性 • 20s • 学生 >= 0.5 >= 0.5  閾値を用いずに尤度の合計から属性判定をする手法もあるが、実験結果を分 析する必要があるために各人に対して閾値で属性を決定
  • 14. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 14 実験設定 • 実験設定: – 学習GPU: • GeForce GTX TITAN X * 4 – ImageNet-1K[12]データセットでSwin Transformerを事前学習 • 精度が最も高いバージョンSwin Lを使用 • 実環境への第一段階であるため,推論時間より精度の方が重要 – パラメータ設定: • 評価指標: – BA (Balanced Accuracy) = ( 𝑇𝑃 𝑇𝑃+𝐹𝑁 + 𝑇𝑁 𝐹𝑃+𝑇𝑁 ) × 1 2 Parameter Setting Input size 384×384 Epoch 60 Batch size 8 Optimizer Adam Learning rate 0.0001 [12] Deng, J., Dong, W., Socher, R., Li, L.-J., Li, K. and Fei-Fei, L.: Imagenet: A large-scale hierarchical image database, 2009 IEEE conference on computer vision and pattern recognition, Ieee, pp.248–255 (2009).
  • 15. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 15 実験1:交差検証 (1/3) • データセット① • 学習方法:Group K-Fold + Stratified K-Fold – 人物IDと属性比率によって五個のFoldを分けて学習 – 各Foldのtrainとtestで属性の分布を同じにする – 通常のKFold手法より効果がある • 各Foldの実験結果比較: – Fold-0はベストモデル データ セット 撮影時期 画像数 人物数 人物ごと の画像数 補足 ① 2021-11 & 2022-01 3,198 527 1~20 実験1用 (交差検証) Fold BA Fold-0 0.730 Fold-1 0.669 Fold-2 0.698 Fold-3 0.706 Fold-4 0.705 平均 0.707
  • 16. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 16 実験1:交差検証 (2/3) • 閾値を決める実験 – 前述の実験では属性ごとに閾値一律0.5として設定 – 閾値は0~1の範囲で0.01ずつ変化させて検証実験を実施 – BAが最も高い時の閾値を採用 – 最適な閾値を適用することで、属性推定の結果が5.6%上昇 クラス 属性 BA Threshold = 0.5 BA 閾値 性別 女性 0.844 0.859 0.55 男性 0.837 0.847 0.57 年代 0-5 0.850 0.960 0.08 6-19 0.792 0.812 0.39 20s 0.673 0.685 0.12 30-40s 0.615 0.663 0.09 50-60s 0.639 0.688 0.31 70~ 0.836 0.850 0.08 その他 学生 0.772 0.775 0.59 子連れ 0.562 0.688 0.21 旅行者 0.497 0.710 0.13 平均 0.720 0.776 最適 閾値 閾値による属性ごとの精度の変化
  • 17. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 17 実験1:交差検証 (3/3) • 全画像と人物ごとの比較実験 – 全画像:単一の人物画像に対して評価 – 人物ごと:同一人物の複数画像に対して評価 • 同一人物の複数画像を使うことで、BAが6.9%向上 – 各属性のBAが上昇 – 旅行者と子連れの検出は大幅に改善 – 20s~60s年代属性の精度の向上は比較的低い クラス 属性 全画像 人物ごと 性別 女性 0.795 0.859 男性 0.793 0.847 年代 0-5 0.862 0.960 6-19 0.747 0.812 20s 0.651 0.685 30-40s 0.638 0.663 50-60s 0.611 0.688 70~ 0.785 0.850 その他 学生 0.739 0.775 子連れ 0.575 0.688 旅行者 0.580 0.710 平均 0.707 0.776
  • 18. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 18 実験2:データセット②での検証結果 (1/4) • 実験2設定: – データセット② – 実験1で得た最適閾値を適用 – 実験1で得たFold-0のモデルを使用 • 人物ごとで平均精度が3%上昇 – 男性、0-19、70~の属性推定精度が大幅向上 – 女性、20s-60s、学生の属性精度少し低下 – 子連れと旅行者の精度はほぼ変化なし クラス 属性 全画像 人物ごと 性別 女性 0.799 0.783 男性 0.694 0.783 年代 0-5 0.991 1.000 6-19 0.772 0.925 20s 0.602 0.549 30-40s 0.708 0.697 50-60s 0.535 0.500 70~ 0.731 0.935 その他 学生 0.730 0.711 子連れ 0.994 1.000 旅行者 0.499 0.500 平均 0.732 0.762 データセット 撮影時期 画像数 人物数 人物ごと の画像数 補足 ② 2022-01 697 25 8~53 テスト実験でのみ使う
  • 19. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 19 実験2:データセット②での検証結果 (2/4) • 年代クラスの結果(画像ごと) – 697枚画像 – 年代の誤分類幅のばらつきが大きい • 20sと50-60sの年代分類は一個ずれている画像が多い 年代属性ごとの誤分類幅と画像数 年代属性の混同行列結果
  • 20. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 20 年代の誤推定の画像例 FP: 0-5 GT: 70~ 全身にモザイク FP: 0-5 GT: 20s 黒つぶれかつ 上半身が乗客と オクルージョン FP: 70~ GT: 50-60s 黒つぶれ (画像ピクセルのヒスト グラムが左に偏っている) FP: 30-40s GT: 50-60s 後ろ姿により人目にも 判別しにくい FP: 70~ GT: 20s 全身にモザイクかつ オクルージョン FP: False Positive GT: Ground Truth
  • 21. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 21 実験2:データセット②での検証結果 (3/4) • 年代クラスの結果(人物ごと) – 25人中14人を誤推定 – 20sと50-60sの分類結果は一個ずれている例が多い – 画像ごとの結果と比べ、年代が大幅にずれている例が減少 年代属性ごとの誤分類幅と人数 年代属性の混同行列結果
  • 22. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 22 実験2:データセット②での検証結果 (4/4) • 他のクラスの結果 – 性別 • 25人中4人を誤推定 – 学生: • 25人中7人を誤推定 – 子連れ: • データセットに含まない – 旅行者: • 検出できなかった クラス 属性 TN FP FN TP 性別 女性 16 1 3 5 男性 5 3 1 16 その他 学生 11 3 4 7 子連れ 25 0 0 0 旅行者 24 0 1 0
  • 23. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 23 実験2:結果例(1/3) • 間違った結果例 • 女性 • 20s 乗車画像には黒つぶれが多くかつ 降車画像にスーツケースが映らなかった ことが原因で年代と旅行者を誤推定 • 男性 • 30-40s 乗車画像には黒つぶれが多くかつ 降車画像でのモザイク処理と服装が 原因で性別と年代の誤推定 GT: • 女性 • 30-40s • 旅行者 GT: • 女性 • 50-60s 推定: 推定: ... ...
  • 24. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 24 実験2:結果例(2/3) • 間違った結果例 • 男性 • 30-40s • 学生 乗車画像でのモザイク処理かつ コートとカバンの色が近いことが 原因で年代の誤推定 降車画像の明るさが要因で服装 が変わって見える問題と髪型が 原因で性別と学生の誤推定 • 男性 • 70~ GT: • 男性 • 20s GT: • 女性 • 30-40s 推定: 推定: ... ...
  • 25. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 25 実験2:結果例(3/3) • 正しく推定できた例 – 一部のフレームで誤推定が出たが、最終的な結果は正しい • 女性 • 30-40s • 女性 • 20s • 学生 フレーム数:35 属性 検出した数 女性 19 男性 16 0-5 1 6-19 12 20s 21 30-40s 1 学生 23 フレーム数:47 属性 検出した数 女性 30 男性 17 6-19 1 20s 12 30-40s 29 70s 5 学生 4 ... ...
  • 26. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 26 学習画像数による精度の変化を検証 • 画像数が多い属性に対して、学習に用いられる画像数を減ら して、精度の変化を検証  学習画像を減らしたら、精度の低下が見られた  学生と20s属性の精度が大幅に下がった  画像数を増やせば更なる精度向上が期待できる 属性を持つ画像数による属性の精度の変化
  • 27. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 27 まとめ • Swin Transformerを用いたバス乗客の属性推定アルゴリズムを提案 し,その検証を行った • 検証のために実際に運行する路線バスの乗降口にカメラを 設置して撮影およびアノテーションを行いデータセットを 作成した • 同一人物の複数画像で属性推定器の精度の向上が確認でき、 性別、0-5、6-19、70~の属性において十分な精度を達成した • 属性推定器の誤検知を考察し、特に明るさ、モザイク処理とオク ルージョンの要因により誤検知しやすいことを確かめた • 実環境への第一段階として、バス乗客属性推定の実用性を示した
  • 28. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 28 研究業績 • 国内学会発表2回 – 鐘 支俊, 横山 想一郎, 山下 倫央, 川村 秀憲, 佐藤 好美, 長谷川 怜, 平澤 幸:Swin Transformer を用いたバス乗客属性の推定, 第21回複雑系マイクロシンポジウム, 9, オンライン(2022) – Zhijun Zhong, Soichiro Yokoyama, Tomohisa Yamashita, Hidenori Kawamura, Yoshimi Sato, Rei Hasegawa, Miyuki Hirasawa : Attribute Estimation of Bus Passenger Using MPNTrack and Swin Transformer, Workshop of Social System and Information Technology (WSSIT2023), (2023, 発表予定) • 国際学会発表1回 – Zhijun Zhong, Soichiro Yokoyama, Tomohisa Yamashita, Hidenori Kawamura, Yoshimi Sato, Rei Hasegawa, Miyuki Hirasawa : Estimation of Bus Passenger Attributes Using Swin Transformer, The 5th International Conference on Artificial Intelligence and Pattern Recognition (AIPR), Xiamen, China, September (2022)

Notas do Editor

  1. 研究背景の「分析フェーズで活用」に車内デザイン (お年寄りが多いなら手すりの量が多かったり座席間隔が広かったり, 逆に学生が多いなら座席減らして1度に大人数乗れたり) と車内広告のことも書きたい(属性情報の重要性を語るのに乗客利用状況の把握が直接的にアピールできるポイントなので) 属性情報がサービスの改善において有用 子連れ、高齢者などの乗客を把握 ➞ 優先席へ誘導する、運転手の注意を喚起 通勤、通学、旅行などの利用目的を推測 ➞ 路線策定と運行管理 OD推定、Re-IDタスクの精度の向上
  2. ICカード 全員が利用してるわけではない 記名カードの発行枚数は全体のおよそ6割 じょうこう 属性情報がサービスの改善において重要 子連れ、高齢者など補助が必要な乗客を検出 ➞ 優先席へ誘導する、運転手の注意を喚起 通勤、通学、旅行などの利用目的を推測 ➞ 路線策定と運行管理 OD推定、Re-IDタスクの精度の向上
  3. この精度を達成出来たら何をできる?
  4. バス事業者が分析フェーズで利用
  5. 人が見た程度の年齢で判断できれば十分としているから問題ない 実際に運転手の個人の判断によるので
  6. 従来研究でよく使われてる三つのオーペンデータセットにおいて、それぞれに一万以上の画像がありますが、推定のBest結果は表に示す通りで、八割前後でした。 それに比べて、今回はより難しくかつ少ないデータを使うため、従来の研究の近い精度の75%を目指して研究を行います。
  7. 精度の改善が小さかった 
  8. BN-Inception モデルによる
  9. =>  画像ごとの間違ったところを分析したいとか…
  10. 誤差率 = 1- TP 𝑐 人物数 * 100% , C:同じクラス(性別、年代) Precision = 𝑇𝑃 𝑇𝑃+𝐹𝑃 Recall = 𝑇𝑃 𝑇𝑃+𝐹𝑁 F1-score = 2𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛×𝑅𝑒𝑐𝑎𝑙𝑙 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+𝑅𝑒𝑐𝑎𝑙𝑙
  11. ずれている年代の分布    画像例 右図を調整
  12. 図の色
  13. ずれている年代の分布    画像例
  14. Id: 7 0.95 0.37 0.11 0.21 0.58 0.58 0.00 0.00 0.53 0.05 0.00 Id: 12 0.45 0.84 0.00 0.00 0.03 0.42 0.10 0.42 0.00 0.00 0.002
  15. Id: 11 0.00 1.00 0.00 0.10 0.10 0.10 0.15 0.45 0.20 0.00 0.00 Id: 19 0.61 0.67 0.00 0.00 0.33 0.72 0.00 0.00 0.61 0.00 0.00
  16. 2 0.59 0.70 0.04 0.59 0.59 0.04 0.00 0.00 0.85 0.00 0.00 25 0.87 0.37 0.00 0.02 0.26 0.80 0.00 0.11 0.09 0.00 0.00
  17. 性別、0-5、6-19、70sの属性において