Mais conteúdo relacionado Semelhante a 人間とのインタラクションにより言葉と行動を学習するロボット(岩橋 直人) (20) Mais de KIT Cognitive Interaction Design (20) 人間とのインタラクションにより言葉と行動を学習するロボット(岩橋 直人)15. 問 題 設 定
15
ここは スマートルーム です
ここの名前はスマートルームここの名前はスマートルーム
この場所は スマートルーム
2
1
対象IDこの場所は 会議室の前
指示
1
対象ID
単語や文法の 知識を持たない ロボットが
文音声と指示対象の ペア から単語とその意味を学習する
言い回し
キーワード
このばしぇおあ
かいでぃひつのまえ
21. 実験用収録音声
21
対象 キーワード 対象 キーワード
1 会議室の前 6 竹内さんのブースの南
2 辻野さんのブース 7 工作室
3 フロアの真ん中 8 アシモの部屋
4 学生部屋の前 9 スマートルーム
5 お茶飲み場 10 スマートルームの入り口
言い回しのパターン
この場所は~ ここは~です ここの名前は~
~の所に行って ~へお願い 今から~へ行って
言い回し6種類 60発話を収録キーワード10種類
音素正解精度は平均 81 %
22. 実験結果( 16名分の平均)
22
203
99
74
51
37
29 25 24 23 23 23
81%
50%
85%
40%
50%
60%
70%
80%
90%
100%
0
50
100
150
200
0 1 2 3 4 5 6 7 8 9 10
音素正解精度
(折れ線グラフ)
単語数(棒グラフ)
単語リスト最適化の回数
獲得単語数 発話の音素正解精度 出力キーワードの音素正解精度
23. 実験結果:提案手法で獲得されたキーワード例
23
正解キーワード 最適化なし 最適化10回
会議室の前 かいすのまえ かいすのまえ
辻野さんのブース つじのさ つじのさうのぶす
フロアの真ん中 なか ふろあどまんなか
学生部屋の前 がくせえべや がくせえべやのまえ
お茶飲み場 おちょ おちゃのいま
竹内さんのブースの南 み たきょいつさんのぶすのみなみ
工作室 こおさくしつ こおさくひつ
アシモの部屋 あしものへや あしものへや
スマートルーム む すもあとるむ
スマートルームの入り口 ち すまとるむのいいぐち
平均音素正解精度 43 % 85%平均 音素正解精度
単語リストの最適化によって分節誤りが修正される
25. 共有信念関数
25
1
,
2
3
4
5
( , ) max log ( | ; , )
log ( | ; ) log ( | ; )
log ( | ; )
log ( , | ; )
log ( , | ; )
l z
T L
M
M
s a p s z L G
p t W L p l W L
p u W L
p t l W R
p t l q H
個別確信度ベクトル
MCE 学習 ML/MAP 学習
信念モジュール
音声言語 HMMs
物体画像
Gaussians
動作 HMMs
動作‐オブジェクト関係
Gaussians
行動のコンテキスト
Multinominal distribution
36. 単語の追加による確認発話生成
f(d(s,a)) が を越えるまで単語を追加
36
箱持ち上げて.
f(d’)
“大きい赤い四角い箱” 0.98
“大きい赤い箱” 0.92
“箱” 0.47
“小さい青い箱” 0.08
“青い箱” 0.01
大きい赤い箱持ち上げて、
いいですか?