2. 研究背景 (1)
p 未曾有の高齢化 の到来
n 超高齢社会に既に突入
l 老人(65歳以上)が総人口の21%以上
n 2030年には人口の1/3が高齢者に!
p 超高齢社会に伴う問題 とは?
n 若者の負担の増加
n 一人暮らしの老人の増加
n 介護・医療サービスへの高すぎる需要
22016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」
人手による高齢者支援の限界
高齢者生活支援のための
見守りシステムの構築
増え続ける若者の負担
7. 本研究の貢献
1. 大規模生活行動データベースの構築
p 新たに被験者18名分の生活行動を収録
p 被験者18名 250時間分の生活行動コーパスを構築
2. 被験者オープン条件での性能を評価
p 上記コーパスを利用
p システムの実用上の性能を評価
3. DNN適応手法を生活行動認識に適用
p 音声認識で広く用いられている適応手法に注目
p 少数のデータのみで性能を改善
72016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」
8. 目次
1. 研究背景及び目標
2. データベースの構築
3. 提案手法
4. 評価実験
A) 被験者クローズ実験
B) 被験者オープン実験
C) 適応実験
5. まとめと今後の課題
82016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」
23. モデルの学習
2016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」 23
1. Denoising Auto Encoder [1] によるPre-training
2. Back prop + Dropout [2] + Adam [3] によるFine-tuning
[1] V. Pascal et al., “Extracting and Composing Robust Features with Denoising Autoencoder,” Proc. of ICLR2008.
[2] D. P. Kingma et al., “ADAM: A Method For Stochastic Optimization,” Proc. of ICLR2015.
[3] G. E. Hinton et al., “Improving neural networks by preventing co-adaptation of feature detectors,” CoRR, 2012.
24. モデルの適応 (1)
三種類の適応手法を検討
1. すべての層のパラメータを再学習
n 最も単純な手法
n グローバルモデルを初期値に設定
n データ量が少ないと過学習に陥りやすい
2. 特定の層を選択しそのパラメータを再学習 [4]
3. 線形変換層を挿入しそのパラメータを学習 [5]
242016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」
[5] Ochiai T., et al., “Speaker Adaptive Training for Deep Neural Networks Embedding Linear Transformation Networks,” Proc. ICASSP 2015, pp.4605–4609, 2015.
[4] Ochiai T., et al., “Speaker Adaptive Training Using Deep Neural Networks." Proc. ICASSP 2014, pp. 6349–6353, 2014.
25. モデルの適応 (2)
p 特定の層を選択しパラメータを再学習 [4]
n 特定の層を被験者依存層として選択
n 被験者が変化する場合は被験者依存層のみを入れ替え
n 少数のパラメータのみを保持すればOK
252016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」
[4] Ochiai T., et al., “Speaker Adaptive Training Using Deep Neural Networks." Proc. ICASSP 2014, pp. 6349–6353, 2014.
26. モデルの適応 (3)
p 線形変換層を挿入しそのパラメータを学習 [5]
n 被験者依存性を正規化するような線形変換を学習
n 被験者が変化する場合は線形変換のみを入れ替える
n 線形変換のパラメータのみを保持すれば良い
262016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」
構築済み
グローバルモデル
線形変換
ネットワークを挿入
[5] Ochiai T., et al., “Speaker Adaptive Training for Deep Neural Networks Embedding Linear Transformation Networks,” Proc. ICASSP 2015, pp.4605–4609, 2015.
28. 被験者オープン実験
p 被験者オープン実験とは
n 学習データとテストデータが異なる被験者
n システムの実用上で重要な指標となる
p 複数人データセットを利用
n 被験者 18名 250時間分のデータ
p Leave-one-subject-out 検証による評価
n 認識対象行動 9種類を分類対象に
n F値を評価指標に
282016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」
40. まとめ
p マルチモーダル信号を用いた深層学習に基づく
行動認識モデルとその適応手法について検討
n 環境音信号 ✕ 加速度信号 ✕ 深層学習
p 日常生活行動データベースの構築
n 被験者19名 約300時間の生活行動を収録
p 被験者オープン実験で実用上の性能を評価
n クローズ評価に比べて大幅な性能の低下
p 適応実験で性能向上の具合を観察
n 適応により少数のサンプルで性能向上の可能性を示唆
n 適応に用いるサンプル数によって適応手法間に差が存在
402016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」
66. 行動認識に関する先行研究
p 日常生活行動に関する音響イベント検出
n HMMを用いた健康管理に関する音響イベント検出 [ Peng et al., 2009 ]
n 確率的生成モデルに基づく音響イベント系列推定 [ Imoto et al., 2013 ]
p 加速度信号を用いた行動認識
n 携帯端末の加速度センサを用いた歩行などの単純な行動認識 [ Ouchi et al., 2012 ]
n 加速度センサを用いた単純な行動認識 [ Kwaipisz et al, 2010 ]
p マルチモーダル信号を用いた行動認識
n スマートフォンで収録された加速度と環境音による段階的な生活行動認識 [ Ouchi et al, 2014 ]
n 腕時計型複数センサデバイスを用いた日常生活行動認識 [T. Maekawa et al., 2013]
662016/08/24 音声研究会@京都大学 「Deep Neural Networkに基づく日常生活行動認識における適応手法」
2. 高次の生活行動が不十分な認識率であること
3. 個人ごとにモデルを構築する必要があること
先行研究の3つの問題点
1. 模擬的に収録された限定的な行動が対象であること