O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
知能が作る社会・社会が作る知能:
HAI研究による知能と社会のデザイン
ヒューマンエージェントインタラクション研究室
筑波大学 助教 大澤博隆
http://hai.iit.tsukuba.ac.jp/
略歴
-2009/3 慶應義塾大学情報工学科 安西・今井研究室
博士(工学) 家電の擬人化
2009/4-2010/3 慶應義塾大学情報工学科 安西・今井研究室(学振DC1)
2009/9-2010/3 MIT AgeLab 訪問研究員 老人向...
研究内容
• 擬人化とインタフェース
– 人間らしさの探索と応
用
• 社会的知能
– シミュレーション・
コミュニケーションゲー
ム
しゅみ
• SF(小説・漫画)、中国古典、海外漫画、ビデ
オゲーム等
りれき
• 小学校
– ゲームで遊ぶのが好き
– 小説も好き
• 中学・高校時代:プログラミング
– ゲームを作れる→すごい→やろう
略歴
• 高校時代:プログラミング→
人工知能/人工生命
• ロボット
– 当時「身体性」という言葉が流
行りだった
• 慶應義塾大学に入る
– SF研とロボット技術研究会
• 理論(?)と実践
技術的特異点と人工知能
– 技術的特異点(シンギュラリティ)を知
る
• 人類史の進化が予測つかなくなる段階
• 最近ブームだけど概念は結構前からある
– 人間の文化が計算機に置き換わる段
階
• DNAの時代の終わり
– 人工知能研究をやろう...
ロボットとコミュニケーション
• 人工知能ぽいのがやりたい
– 安西先生「基礎から学ぶべき」
– 今井先生「コミュニケーションが
一番おもしろい」
• ロボットにハグされる
– インパクトある
– なんかおもしろいかもしれない
本質はどこか
• ロボットが大事なのか?
– ロボットのハードウェアは本質じゃない
– 人間が何を感じるかが大事
• 特徴なのか?外見なのか?
→擬人化の研究へ
最近
• 人工知能学会会員
• 表紙騒動
• 大変嫌だ
• どちらかというと嫌
• 問題ない
• 大変よろしい
• 大きな問題点
– ジェンダー
– タスク
– ケーブル
– 表情
人工知能学会表紙問題
• 突っ込んでいたら特集記事を
書くことに
• いつのまにか編集委員に
• いつのまにか発表
– 11/16 STS学会WS(阪大)
HAIと知能の社会的側面
ヒューマンエージェントインタラクション
• 人らしいロボットとかエージェントみたいなの
使うやつ……?
– それだけではない
• 「人間という外界とインタラクションを持つ自律
システムや自律にみせかけるシステム」を広
範に扱う
– 相手からどう...
HAIの視点
• 知能がどう動いているかではなく、知能が「人
間からどう受け取られるか」が最も重要
– 認知科学の観点
• ロボットの機能主義と生命模倣主義との調和
「なぜ人に似せるのですか?」
「人らしさ」とは何か?
• 議論を呼ぶ問い…
• 「他者の意図を発見する」という点にフォーカ
スする
– 意図姿勢
– メディアの等式
– 疑念の留保
意図姿勢とエージェント
! !
起きて!
物理姿勢 設計姿勢 意図姿勢
ダニエル・C・デネット, 「志向姿勢」の哲学―人は人の行動を読めるのか?,白揚社
メディアの等式
同じPC: 性能はどうでしたか?
違うPC:
性能はどうでしたか?
作業中
作業中
B Reeves, Cliff Nass, The Media Equation: How people treat computers,
te...
疑念の留保(Suspension of disbelief)
• 演劇を見るときに疑問を持たない
– 疑問を持つほうが認知負荷が低い
Brian R Duffy, Karolina Zawieska, Suspension of Disbeli...
HAIのアプローチ
• 人間から「他者」と認識されるものを工学的に利
用する
– 人間が環境中に他者を見つける働きを応用
– それが無意識か意識的かに関わらない
→社会の中で効用をなす知能、社会的知能
• HAIは何をするべきか
– 何が社会的...
HAIの実装例
人間らしさをどう活かすか
HAI研究とアプリケーション
• 対話エージェント、ロボット、テレプレセンス
– 情報提示
– 医療(自閉症、認知症)
– 介護
– 教育
– コミュニケーション支援
弱さを利用するロボット
• Social Trash Box(豊橋技科大)
うなずきの利用
• ペコッぱ(岡山県立大)
人を癒やすエージェント
• アザラシ型ロボットParo(産総研)
人を代替する
• Geminoid(ATR、阪大)
心を表すエージェント
• 内部処理の映像表示(尾関、岡、京都工芸繊
維大)
エージェントが乗り移る
• ITACO(はこだて未来大)
家電を擬人化する
HRI 2008
• ディスプレイロボット(慶大、大澤)
家電を擬人化すると
• 家電の機能をより良く覚える
– 自己紹介型を取るため?
実験結果(視線に注目)
擬人化されたプリンタ Robovie
• 対象を見てない
– エージェントを見る
• 対象を見てる
エージェントの形状が変わる
• Morphing Agency(慶大、大澤、今井)
リアルとバーチャルを行き来する
• BReA(慶大、金井、大澤、今井)
– スクリーンと実世界情報を移動するエージェント
による情報提示
肩にエージェントを乗せる
• TEROOS(慶大、柏原、大澤、今井)
手をエージェントにする
• Pygmy(慶大、尾形、大澤、今井)
というかもう人をエージェント化する
• AgencyGlass(筑波大、大澤)
知能の軍拡競争
社会的知能の発生要因を調べる
社会脳仮説
• 人間(や霊長類イカも?)は他者の意図を推測
するために自らの脳を大きくした
相互信頼・意図推測の発生条件
• 相手の意図を読む知性が生まれうるのは、ど
のような条件(=利得表)があるときか?
– 意図を読むエージェントを進化させる条件
Hirotaka Osawa, Intelligence Arms Race: De...
信頼=時間差のある取引の成立
• 富の交換にタイムラグがある
– 相手のモデル化が必要
– 相手があとで富を返すという『信頼』が必要
例:ツケ払い
利得表
• 3種の利得条件
(1) IPD: 繰り返し囚人のジレンマ
(2) MMPD: 複最大条件の繰り返し囚人ジレンマ
(3) AMPD: 反最大条件の繰り返し囚人ジレンマ
IPDとAMPDの違い
IPD
• 両者裏切りがナッシュ均衡
• 両者協調がパレート最適
– ジレンマ
• 単純な戦略が頑健
– TFT(しっぺ返し):前回の相手
の手を真似る
– GRIM:一度やられたらそれ以
降全て裏切る
AMPD
• 一...
信頼のための意図のモデル化
• 時間差のある取引では、相手が信頼に値す
るかどうか、モデルを保つ必要がある
ゲーム設計
• 利得を得る際に時間差の必要なゲームを
エージェントに課す
– Anti-max Prisoner’s Dilemma Game (AMPD)
• AMPDに拒絶条件を入れる
– 自由取引に近づける
人間による事前シミュレーション
• 74人の被験者がエージェントの戦略を記述、
28日間(1日4回更新)で順位を競う
• 各エージェントの戦略をオートマトンで記述
webフォームでの戦略登録
• オートマトンの入力:前回の相手の手
(待つ、出かける)
– 待つ: 0
– 出かける: 1
• オートマトンの状態:今回の自分の手
(待つ、出かける)
– 待つ: 偶数自然数(2,4,6...)
– 出かける: ...
結果
• 上位陣において、オートマトン
が爆発的に複雑化
結果の解析
• 相手を認証する
メタ戦略が発生
• 認証を発達させる
ジレンマの存在
– 相手を信じすぎると搾取
されるが、早い段階で見
限ると信頼出来る相手を
見逃す
計算機によるシミュレーション
• 50個のエージェントが進化しながら1500世代
の間、総当り戦を行うゲーム
• IPD、MMPD、AMPDそれぞれ100ゲーム
3 * 2 > -3 + 7
2 * 2 = -3 + 7
1 * 2 < -3 ...
エージェントの戦略の進化
• 各エージェントの戦略をオートマトンで記述
• 初期シードとして単純な戦略を記述
– 2ノード、4枝で記述できる戦略32種をランダムに
配置
• 遺伝的プログラミングにより進化させる
初期オートマトンの例
• Believer: 全て協調
• Attacker: 全て裏切り
• TFT: 初回協調。その後相手の手を真似る
• aTFT:初回裏切り。その後相手の手を真似る
• Pavlov: 裏切られたら手を変える
• GRI...
遺伝的プログラミングの手続き
• 突然変異
– ノードの変化
– 枝の変化
– 新しいノードの追加
• 交差
– ある木の部分木が別の
木の房に付け加わる
評価
• 以下の2つを使用
– 全枝の数
– 使用した枝の数
– 循環的複雑度
(Cyclomatic Complexity)
• ユニーク枝 - ノード数
– 使用したオートマトンの
循環的複雑度 例
All edges: 18
Used e...
IPD
• 単純な戦略に収束(ほぼGRIM)
0
10
20
30
40
50
60
0
0.5
1
1.5
2
2.5
3
1 201 401 601 801 1001 1201 1401
all edges used edges avera...
MMPD
• 92のケースで単純な
戦略に収束
• 8のケースで木の枝
が増加
– ただし、内訳は既存の
枝の複製で、ほぼ使
用されていない
– 「使用された枝」に
限ってみると増加して
ない 0
5
10
15
20
25
30
35
40
...
AMPD
• 57のケースで単純な戦
略に収束
– (attacker or GRIM, 最大
スコア1)
• 43のケースで戦略が増
大
• 全ての枝、使用された
枝の両方が増加
– 全ての枝が378(51~
1525, SD=438)、使用...
• 総合的な循環的複雑度が172 (20~720,
SD=202)、使用された循環的複雑度が平均で
7.0(4.5~9.5の間)になる
– 赤:使用された枝の増加
– 青:使用された木の循環的複雑度の平均値
– 灰色:標準偏差
• IPD、MM...
ミクロな分析
• 平均的なサンプルを一つ取って分析
– どのような進化が起きているか
0
5
10
15
20
25
30
-1
-0.5
0
0.5
1
1.5
2
2.5
1
28
55
82
109
136
163
190
217
244...
1~48世代
• 戦略の長さの増加
0
0.5
1
1.5
2
2.5
3
3.5
-1
-0.5
0
0.5
1
1.5
2
1
10
19
28
37
46
55
64
73
82
91
100
109
118
127
136
145
al...
49~102世代
• 既存の戦略を取り込んだ複雑化
• 線形ではなく、スキップ・簡易な分岐が登場
– 「やり直そう」「これは飛ばそう」に対応
0
0.5
1
1.5
2
2.5
3
3.5
-1
-0.5
0
0.5
1
1.5
2
1
10
...
• 複雑な分岐の登場
– 「もしこうならこう」に対応?
103~149世代
0
0.5
1
1.5
2
2.5
3
3.5
-1
-0.5
0
0.5
1
1.5
2
1
10
19
28
37
46
55
64
73
82
91
100
10...
1500世代後
• 循環的複雑度が25
– 25の分岐が存在する
• 分析が難しい…
0
5
10
15
20
25
30
-1
-0.5
0
0.5
1
1.5
2
2.5
1
59
117
175
233
291
349
407
465
5...
各世代の知性
• 少なくとも単純な戦
略には適応
– Believerから搾取
– AttackerやGRIMと
はお互い裏切りで
決着(最適解)
– TFTやaTFTとは協調
– Pavlovとはあまり協
調できない
-300
-200
-1...
応用:意図の表出による
機器の長期的使用
• 得られた戦略を、擬人化した機器の戦略とす
る
– 機器に対する興味を持続できるのでは?
– 「情動を喚起することが大事」
65
人狼知能プロジェクト
社会的知能評価のためのグランドチャレンジ
Are you werewolf?
人狼ゲーム
• コミュニケーションゲーム「人狼」
– 村人の中に隠れた狼を
議論と処刑を用いて当てる
– 村人:毎晩一人人間を処刑
– 人狼:毎晩一人村人を襲撃
– 占い師:毎晩一人対象が
人間か狼か見分ける
人狼の背景
• 全世界的に親しまれている
– ロシアの伝統ゲーム
• 日本の人狼はオンラインゲームとして発展
– 10年間、数千件の
対戦データが存在
http://ninjin002.x0.com/wolff/
オフライン・オンライン人狼の違い
カード型人狼:パーティゲーム
• 一試合十数分程度
– 短い会話で嘘がつけるか
• 顔が見える環境での競争
– 相手の性格や反応を見る
• 狼同士の会話はジェスチャ
オンライン型人狼:言語ゲーム
• 一試合数日...
人狼知能プロジェクトとは何か?
• 人狼を解く人工知能を作る
– 人間の代わりに振る舞うエージェント
– コンテストの形式で行う(チェス・将棋・
ロボサッカーと同様)
人狼ゲームの特徴
1. 客観視点での情報不確定性
– 完全情報ゲームとの違い
※CO = カミングアウト、役職告白
人狼ゲームの特徴
2. 推理:他者の意図のモデル化
– 文脈からの真偽の判断
– 重み付けは各プレイヤーが行う
人狼ゲームの特徴
3. 説得:他者から見た
自己のモデル化
担当
• 鳥海不二夫:全体統括・サーバ作成
• 稲葉通将:オンラインデータ解析
• 大澤博隆:プロコトル作成
• 片上大輔:対人プレイ分析
• 篠田孝祐:システム設計
• 梶原健吾:クライアント作成
• 松原仁: ルール設計・広報
人狼プロトコルの開発
• 自然言語は扱いが難しい
• 人狼で行われる会話を
モデル化した言語設計
– BDI論理に基づく
– プログラムに扱える
範囲で、かつ記述可能
な範囲をなるべく広げる
人狼プロトコルの例
• 「Onoさんは人狼でしょう」
– declare 90% (Ono wolf) : Onoが人狼であると90%確
信
• 「その意見には反対だな」
– agree 0% (speech 10) :10番目の会話に同意しな...
BDI論理を使った推論
• 人狼BBS 1村
人狼知能達成における
エージェントの推論モデル
• BDI論理を使うことで、人狼における複雑な推論(入れ子の推
論)を記述可能となる。
• ログから検証
BEL𝐽𝑜𝑎𝑐ℎ𝑖𝑚 AX ¬Do ∀𝑝𝑒𝑜𝑝𝑙𝑒 𝑒𝑥𝑐𝑒𝑝𝑡 𝐴𝑙𝑏𝑖𝑛, tell,...
BDI論理による推論表現
• 占い師を演じる狂人の襲撃に失敗した人狼
が、狂人を庇う村人の動きから、その村人が
狂人を護衛した狩人と見抜く
BEL 𝑂𝑡𝑡𝑜
(BEL 𝑀𝑜𝑙𝑖𝑡𝑧
Is Otto, VILLAGESIDE ) → BEL 𝑂𝑡𝑡𝑜
(Is(Molitz, hunter))
Is x, attacked ∩ AX(Is x, live ) → Is x, guard...
• 不注意な人間の行動を、それゆえに信じる
グランドチャレンジとしての利点
• 社会的知能(他者への推論)を要求される課題である
– 相手のモデルのシミュレーション、相手の中の自分の思考のシミュ
レーションが必要
– 可能世界論やBDI論理のような人工知能手法が実用化
• しかしながら、...
人狼対戦サーバ
• 人狼知能をエージェントとして互いに対戦可
能なサーバ
• 将来的には人間との対戦も実現
人狼サーバ人狼サーバ
人狼プロ
トコル
人狼
プロトコル
翻訳
モジュール
自然言語
感情表現
モジュール
人狼
プロトコル 表情
• 会話• 会話
• 投票
• 能力者の行動決定
• 投票
• 能力者の行動決定
• 吊り、襲撃処理
• 占、霊へ情報提供
• 勝敗処理
• 吊り、襲撃処理
• 占、霊へ情報提供
• 勝敗処理
• 会話ゲーム開始ゲーム開始
ゲーム終了ゲーム終了...
全員の話し合い全員の話し合い
会話終了会話終了
共鳴者の会話共鳴者の会話
人狼の話し合い人狼の話し合い
人狼の
話し合い
人狼の
話し合い
1日の始まり1日の始まり
話し合いに参加するエージェ
ントの並び替え(ランダム)
話し合いに参加するエー...
シンプルな人狼のモデル化
• 人狼のシンプル化
– 発話:特に必要な発話のみ
• 役職のカミングアウト
• 能力によって得られた情報の共有
• 疑っている対象の報告
– 疑い度:プレイヤーの状態から人狼らしさを推測
• Q学習を用いて戦略を学習...
学習内容
• 襲撃,処刑等の対象選択方法
• 発話内容
• 人狼側が嘘をついて装う役職
• プレイヤーの疑い度
87
人狼・学習無 人狼・学習有
人間・学習無 38.6% 22.3%
人間・学習有 52.9% 36.4%
結果(1/3)
• 学習の有無による人間側の勝率の変化
戦略の学習によって
勝率の向上が得られた 88
結果(2/3)
• 人狼側の戦略ごとの人間側の勝率の変化
• 実データと比較して高い相関(0.766)
→人間に近い戦略の学習に成功
89
結果(3/3)
• 上級者が用いる手法の発見
– 生き残り人数が5人の時、襲撃における最適戦略
↓
“誰も襲わない”
高度な戦略の学習が可能であることを発見
90
人狼の詳細情報はこちら
http://aiwolf.org/
サーバ公開中
11/19 日吉キャンパス、横浜
人狼知能エージェント
作成セミナー
(※まだ若干枠があります!)
感情労働を補佐する技術としての
HAI
社会的知能を応用する
研究提案:HAI技術の新しい応用
• 機械の擬人化から人間の擬人化へ
• 感情労働を肩代わりするためのHAI技術利用
– 人間の社会的行動の補佐
感情労働とは何か?
• 労働者が、他人の感情に合わせて行動する
必要がある種類の労働 [Hochschield 83]
– 肉体労働・頭脳労働に並ぶ労働
– 客室乗務員・介護・教育など
感情労働≒社会的な知能を要する労
働
• 高度な知能を要する課題
– 感情労働は相手のモデル化を要求する
– 社会脳仮説
HAIでのエージェントの応用
• 感情労働の対象とする
領域と、HAI研究で提案
されてきた応用範囲が
重なる
– 介護・教育・情報提示
– HAI技術は感情労働の
代替?
代替としての技術・補佐としての技術
部分的な自動化の利点
• 社会的応用に結びつきやすい
• 市場が存在する
プロトタイプの提案:AgencyGlass
実装とデモ
• センサによるジェスチャ
拡張
• 外部カメラとの連動
– 相手の視線を追いかけ
る
• Joint attention
反応
• 3/1: インタラクション2014デモ
• 3/6: HRI 2014 video presentation
• 3/10: NewScientist
– 技術的な詳細が主
• 4/11: IEEE blog, 4/17: BBC
–...
Youtubeのコメント
• 評価 賛4:否1
• コメント
– 賛14件、否10件、どちらでも
ない36件
• 賛成
– 代替に賛成、感情表現が苦
手な人に良い
• 否定
– 外見が不気味、こわい
• どちらでもない
– 日本特有?
議論(1/2)
• Dr. Berthouzeによる指摘
– 異種文化の表現を変換する技
術に使えるのではないか
• Garciaの記事: Rappler
– 文化に依存するので難しい
• Huffington Postの議論
– アスペルガー...
議論(2/2)
• 意外に多くの需要が存在する
– 感情労働は日本に限らない
– 自動化は補佐に絞る
• 自動化と教示のバランスに注意する
Próximos SlideShares
Carregando em…5
×

知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)

1.820 visualizações

Publicada em

•擬人化とインタフェース
 –人間らしさの探索と応用
•社会的知能
 –シミュレーション・コミュニケーションゲーム

Publicada em: Engenharia
  • Seja o primeiro a comentar

知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)

  1. 1. 知能が作る社会・社会が作る知能: HAI研究による知能と社会のデザイン ヒューマンエージェントインタラクション研究室 筑波大学 助教 大澤博隆 http://hai.iit.tsukuba.ac.jp/
  2. 2. 略歴 -2009/3 慶應義塾大学情報工学科 安西・今井研究室 博士(工学) 家電の擬人化 2009/4-2010/3 慶應義塾大学情報工学科 安西・今井研究室(学振DC1) 2009/9-2010/3 MIT AgeLab 訪問研究員 老人向けインタフェース 2010/4-2011/3 国立情報学研究所 山田誠二研究室 特任研究員(学振PD) 2011/9- JSTさきがけ研究員 擬人化された動き 2011/4-2012/3 慶應義塾大学情報工学科 安西・今井研究室助教 2012/4-2013/3 慶應義塾大学情報工学科 今井研究室助教 2013/3- 筑波大学システム情報系 助教 意図の読み合い
  3. 3. 研究内容 • 擬人化とインタフェース – 人間らしさの探索と応 用 • 社会的知能 – シミュレーション・ コミュニケーションゲー ム
  4. 4. しゅみ • SF(小説・漫画)、中国古典、海外漫画、ビデ オゲーム等
  5. 5. りれき • 小学校 – ゲームで遊ぶのが好き – 小説も好き • 中学・高校時代:プログラミング – ゲームを作れる→すごい→やろう
  6. 6. 略歴 • 高校時代:プログラミング→ 人工知能/人工生命 • ロボット – 当時「身体性」という言葉が流 行りだった • 慶應義塾大学に入る – SF研とロボット技術研究会 • 理論(?)と実践
  7. 7. 技術的特異点と人工知能 – 技術的特異点(シンギュラリティ)を知 る • 人類史の進化が予測つかなくなる段階 • 最近ブームだけど概念は結構前からある – 人間の文化が計算機に置き換わる段 階 • DNAの時代の終わり – 人工知能研究をやろう • というか人工知能しかやることがなくね?
  8. 8. ロボットとコミュニケーション • 人工知能ぽいのがやりたい – 安西先生「基礎から学ぶべき」 – 今井先生「コミュニケーションが 一番おもしろい」 • ロボットにハグされる – インパクトある – なんかおもしろいかもしれない
  9. 9. 本質はどこか • ロボットが大事なのか? – ロボットのハードウェアは本質じゃない – 人間が何を感じるかが大事 • 特徴なのか?外見なのか? →擬人化の研究へ
  10. 10. 最近 • 人工知能学会会員 • 表紙騒動
  11. 11. • 大変嫌だ • どちらかというと嫌 • 問題ない • 大変よろしい
  12. 12. • 大きな問題点 – ジェンダー – タスク – ケーブル – 表情
  13. 13. 人工知能学会表紙問題 • 突っ込んでいたら特集記事を 書くことに • いつのまにか編集委員に • いつのまにか発表 – 11/16 STS学会WS(阪大)
  14. 14. HAIと知能の社会的側面
  15. 15. ヒューマンエージェントインタラクション • 人らしいロボットとかエージェントみたいなの 使うやつ……? – それだけではない • 「人間という外界とインタラクションを持つ自律 システムや自律にみせかけるシステム」を広 範に扱う – 相手からどう見えるか、という点を重視 山田誠二, 人とロボットの<間>をデザインする. 東京電機大学出版局, 2007.
  16. 16. HAIの視点 • 知能がどう動いているかではなく、知能が「人 間からどう受け取られるか」が最も重要 – 認知科学の観点 • ロボットの機能主義と生命模倣主義との調和 「なぜ人に似せるのですか?」
  17. 17. 「人らしさ」とは何か? • 議論を呼ぶ問い… • 「他者の意図を発見する」という点にフォーカ スする – 意図姿勢 – メディアの等式 – 疑念の留保
  18. 18. 意図姿勢とエージェント ! ! 起きて! 物理姿勢 設計姿勢 意図姿勢 ダニエル・C・デネット, 「志向姿勢」の哲学―人は人の行動を読めるのか?,白揚社
  19. 19. メディアの等式 同じPC: 性能はどうでしたか? 違うPC: 性能はどうでしたか? 作業中 作業中 B Reeves, Cliff Nass, The Media Equation: How people treat computers, television, and new media like real people and places. Stanford, p. 305, 1996.
  20. 20. 疑念の留保(Suspension of disbelief) • 演劇を見るときに疑問を持たない – 疑問を持つほうが認知負荷が低い Brian R Duffy, Karolina Zawieska, Suspension of Disbelief in Social Robotics, International Conference on Social Robotics, pp. 484–489, 2012/9.
  21. 21. HAIのアプローチ • 人間から「他者」と認識されるものを工学的に利 用する – 人間が環境中に他者を見つける働きを応用 – それが無意識か意識的かに関わらない →社会の中で効用をなす知能、社会的知能 • HAIは何をするべきか – 何が社会的な知能を生むか – 社会的知能をどこで応用できるか • “「両方」やらなくっちゃあならない”
  22. 22. HAIの実装例 人間らしさをどう活かすか
  23. 23. HAI研究とアプリケーション • 対話エージェント、ロボット、テレプレセンス – 情報提示 – 医療(自閉症、認知症) – 介護 – 教育 – コミュニケーション支援
  24. 24. 弱さを利用するロボット • Social Trash Box(豊橋技科大)
  25. 25. うなずきの利用 • ペコッぱ(岡山県立大)
  26. 26. 人を癒やすエージェント • アザラシ型ロボットParo(産総研)
  27. 27. 人を代替する • Geminoid(ATR、阪大)
  28. 28. 心を表すエージェント • 内部処理の映像表示(尾関、岡、京都工芸繊 維大)
  29. 29. エージェントが乗り移る • ITACO(はこだて未来大)
  30. 30. 家電を擬人化する HRI 2008 • ディスプレイロボット(慶大、大澤)
  31. 31. 家電を擬人化すると • 家電の機能をより良く覚える – 自己紹介型を取るため?
  32. 32. 実験結果(視線に注目) 擬人化されたプリンタ Robovie • 対象を見てない – エージェントを見る • 対象を見てる
  33. 33. エージェントの形状が変わる • Morphing Agency(慶大、大澤、今井)
  34. 34. リアルとバーチャルを行き来する • BReA(慶大、金井、大澤、今井) – スクリーンと実世界情報を移動するエージェント による情報提示
  35. 35. 肩にエージェントを乗せる • TEROOS(慶大、柏原、大澤、今井)
  36. 36. 手をエージェントにする • Pygmy(慶大、尾形、大澤、今井)
  37. 37. というかもう人をエージェント化する • AgencyGlass(筑波大、大澤)
  38. 38. 知能の軍拡競争 社会的知能の発生要因を調べる
  39. 39. 社会脳仮説 • 人間(や霊長類イカも?)は他者の意図を推測 するために自らの脳を大きくした
  40. 40. 相互信頼・意図推測の発生条件 • 相手の意図を読む知性が生まれうるのは、ど のような条件(=利得表)があるときか? – 意図を読むエージェントを進化させる条件 Hirotaka Osawa, Intelligence Arms Race: Delayed Reward Increases Complexity of Agent Strategies, International Conference on Autonomous Agents (AAMAS 2014), p. (accepted), 2014/5.
  41. 41. 信頼=時間差のある取引の成立 • 富の交換にタイムラグがある – 相手のモデル化が必要 – 相手があとで富を返すという『信頼』が必要 例:ツケ払い
  42. 42. 利得表 • 3種の利得条件 (1) IPD: 繰り返し囚人のジレンマ (2) MMPD: 複最大条件の繰り返し囚人ジレンマ (3) AMPD: 反最大条件の繰り返し囚人ジレンマ
  43. 43. IPDとAMPDの違い IPD • 両者裏切りがナッシュ均衡 • 両者協調がパレート最適 – ジレンマ • 単純な戦略が頑健 – TFT(しっぺ返し):前回の相手 の手を真似る – GRIM:一度やられたらそれ以 降全て裏切る AMPD • 一回の勝負のみで両者の 平均利得を最大化すること ができない – 両者が交互に裏切った時に 利益が最大化 • 相手が裏切ったら、次相手 が信頼を返してくる、という 理解が必要 3 * 2 > -3 + 7 1 * 2 < -3 + 7
  44. 44. 信頼のための意図のモデル化 • 時間差のある取引では、相手が信頼に値す るかどうか、モデルを保つ必要がある
  45. 45. ゲーム設計 • 利得を得る際に時間差の必要なゲームを エージェントに課す – Anti-max Prisoner’s Dilemma Game (AMPD) • AMPDに拒絶条件を入れる – 自由取引に近づける
  46. 46. 人間による事前シミュレーション • 74人の被験者がエージェントの戦略を記述、 28日間(1日4回更新)で順位を競う • 各エージェントの戦略をオートマトンで記述
  47. 47. webフォームでの戦略登録 • オートマトンの入力:前回の相手の手 (待つ、出かける) – 待つ: 0 – 出かける: 1 • オートマトンの状態:今回の自分の手 (待つ、出かける) – 待つ: 偶数自然数(2,4,6...) – 出かける: 奇数自然数(1,3,5...) – 鍵を閉じる: 0 • 状態はいくつ作っても良い
  48. 48. 結果 • 上位陣において、オートマトン が爆発的に複雑化
  49. 49. 結果の解析 • 相手を認証する メタ戦略が発生 • 認証を発達させる ジレンマの存在 – 相手を信じすぎると搾取 されるが、早い段階で見 限ると信頼出来る相手を 見逃す
  50. 50. 計算機によるシミュレーション • 50個のエージェントが進化しながら1500世代 の間、総当り戦を行うゲーム • IPD、MMPD、AMPDそれぞれ100ゲーム 3 * 2 > -3 + 7 2 * 2 = -3 + 7 1 * 2 < -3 + 7
  51. 51. エージェントの戦略の進化 • 各エージェントの戦略をオートマトンで記述 • 初期シードとして単純な戦略を記述 – 2ノード、4枝で記述できる戦略32種をランダムに 配置 • 遺伝的プログラミングにより進化させる
  52. 52. 初期オートマトンの例 • Believer: 全て協調 • Attacker: 全て裏切り • TFT: 初回協調。その後相手の手を真似る • aTFT:初回裏切り。その後相手の手を真似る • Pavlov: 裏切られたら手を変える • GRIM: 一度裏切られたら全て裏切る
  53. 53. 遺伝的プログラミングの手続き • 突然変異 – ノードの変化 – 枝の変化 – 新しいノードの追加 • 交差 – ある木の部分木が別の 木の房に付け加わる
  54. 54. 評価 • 以下の2つを使用 – 全枝の数 – 使用した枝の数 – 循環的複雑度 (Cyclomatic Complexity) • ユニーク枝 - ノード数 – 使用したオートマトンの 循環的複雑度 例 All edges: 18 Used edges: 11 All CC: 14 Used CC: 9
  55. 55. IPD • 単純な戦略に収束(ほぼGRIM) 0 10 20 30 40 50 60 0 0.5 1 1.5 2 2.5 3 1 201 401 601 801 1001 1201 1401 all edges used edges average score
  56. 56. MMPD • 92のケースで単純な 戦略に収束 • 8のケースで木の枝 が増加 – ただし、内訳は既存の 枝の複製で、ほぼ使 用されていない – 「使用された枝」に 限ってみると増加して ない 0 5 10 15 20 25 30 35 40 45 50 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 1 201 401 601 801 1001 1201 1401 all edges used edges average score
  57. 57. AMPD • 57のケースで単純な戦 略に収束 – (attacker or GRIM, 最大 スコア1) • 43のケースで戦略が増 大 • 全ての枝、使用された 枝の両方が増加 – 全ての枝が378(51~ 1525, SD=438)、使用し た枝が27本(18~42, SD=6). 0 50 100 150 200 250 300 -1 -0.5 0 0.5 1 1.5 2 1 201 401 601 801 1001 1201 1401 all edges used edges average score
  58. 58. • 総合的な循環的複雑度が172 (20~720, SD=202)、使用された循環的複雑度が平均で 7.0(4.5~9.5の間)になる – 赤:使用された枝の増加 – 青:使用された木の循環的複雑度の平均値 – 灰色:標準偏差 • IPD、MMPDの場合、 循環的複雑度は最大 2以下 • 意味のある複雑化が 起きている 循環的複雑度の増加 0 5 10 15 20 25 30 0 5 10 15 20 25 30 1 201 401 601 801 1001 1201 1401
  59. 59. ミクロな分析 • 平均的なサンプルを一つ取って分析 – どのような進化が起きているか 0 5 10 15 20 25 30 -1 -0.5 0 0.5 1 1.5 2 2.5 1 28 55 82 109 136 163 190 217 244 271 298 325 352 379 406 433 460 487 514 541 568 595 622 649 676 703 730 757 784 811 838 865 892 919 946 973 1000 1027 1054 1081 1108 1135 1162 1189 1216 1243 1270 1297 1324 1351 1378 1405 1432 1459 1486 all cc used cc average
  60. 60. 1~48世代 • 戦略の長さの増加 0 0.5 1 1.5 2 2.5 3 3.5 -1 -0.5 0 0.5 1 1.5 2 1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 all cc used cc average
  61. 61. 49~102世代 • 既存の戦略を取り込んだ複雑化 • 線形ではなく、スキップ・簡易な分岐が登場 – 「やり直そう」「これは飛ばそう」に対応 0 0.5 1 1.5 2 2.5 3 3.5 -1 -0.5 0 0.5 1 1.5 2 1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 all cc used cc average
  62. 62. • 複雑な分岐の登場 – 「もしこうならこう」に対応? 103~149世代 0 0.5 1 1.5 2 2.5 3 3.5 -1 -0.5 0 0.5 1 1.5 2 1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 all cc used cc average
  63. 63. 1500世代後 • 循環的複雑度が25 – 25の分岐が存在する • 分析が難しい… 0 5 10 15 20 25 30 -1 -0.5 0 0.5 1 1.5 2 2.5 1 59 117 175 233 291 349 407 465 523 581 639 697 755 813 871 929 987 1045 1103 1161 1219 1277 1335 1393 1451 all cc used cc average
  64. 64. 各世代の知性 • 少なくとも単純な戦 略には適応 – Believerから搾取 – AttackerやGRIMと はお互い裏切りで 決着(最適解) – TFTやaTFTとは協調 – Pavlovとはあまり協 調できない -300 -200 -100 0 100 200 300 400 500 600 1 55 109 163 217 271 325 379 433 487 541 595 649 703 757 811 865 919 973 1027 1081 1135 1189 1243 1297 1351 1405 1459 vs believer vs attacker vs TFT vs aTFT vs Pavlov vs GRIM
  65. 65. 応用:意図の表出による 機器の長期的使用 • 得られた戦略を、擬人化した機器の戦略とす る – 機器に対する興味を持続できるのでは? – 「情動を喚起することが大事」 65
  66. 66. 人狼知能プロジェクト 社会的知能評価のためのグランドチャレンジ Are you werewolf?
  67. 67. 人狼ゲーム • コミュニケーションゲーム「人狼」 – 村人の中に隠れた狼を 議論と処刑を用いて当てる – 村人:毎晩一人人間を処刑 – 人狼:毎晩一人村人を襲撃 – 占い師:毎晩一人対象が 人間か狼か見分ける
  68. 68. 人狼の背景 • 全世界的に親しまれている – ロシアの伝統ゲーム • 日本の人狼はオンラインゲームとして発展 – 10年間、数千件の 対戦データが存在 http://ninjin002.x0.com/wolff/
  69. 69. オフライン・オンライン人狼の違い カード型人狼:パーティゲーム • 一試合十数分程度 – 短い会話で嘘がつけるか • 顔が見える環境での競争 – 相手の性格や反応を見る • 狼同士の会話はジェスチャ オンライン型人狼:言語ゲーム • 一試合数日間 – 熟慮した発言が可能 • キャラクターによる匿名化 – 性別や見た目の影響排除 • 狼同士の会話を平衡で行う – コミュニケーションミスの排除
  70. 70. 人狼知能プロジェクトとは何か? • 人狼を解く人工知能を作る – 人間の代わりに振る舞うエージェント – コンテストの形式で行う(チェス・将棋・ ロボサッカーと同様)
  71. 71. 人狼ゲームの特徴 1. 客観視点での情報不確定性 – 完全情報ゲームとの違い ※CO = カミングアウト、役職告白
  72. 72. 人狼ゲームの特徴 2. 推理:他者の意図のモデル化 – 文脈からの真偽の判断 – 重み付けは各プレイヤーが行う
  73. 73. 人狼ゲームの特徴 3. 説得:他者から見た 自己のモデル化
  74. 74. 担当 • 鳥海不二夫:全体統括・サーバ作成 • 稲葉通将:オンラインデータ解析 • 大澤博隆:プロコトル作成 • 片上大輔:対人プレイ分析 • 篠田孝祐:システム設計 • 梶原健吾:クライアント作成 • 松原仁: ルール設計・広報
  75. 75. 人狼プロトコルの開発 • 自然言語は扱いが難しい • 人狼で行われる会話を モデル化した言語設計 – BDI論理に基づく – プログラムに扱える 範囲で、かつ記述可能 な範囲をなるべく広げる
  76. 76. 人狼プロトコルの例 • 「Onoさんは人狼でしょう」 – declare 90% (Ono wolf) : Onoが人狼であると90%確 信 • 「その意見には反対だな」 – agree 0% (speech 10) :10番目の会話に同意しない • 「Onoさんは処刑しましょう.人間とは思えないで すし」 – Request any 90% (execute Ono) because declare 20% (Ono humanside) 76
  77. 77. BDI論理を使った推論 • 人狼BBS 1村
  78. 78. 人狼知能達成における エージェントの推論モデル • BDI論理を使うことで、人狼における複雑な推論(入れ子の推 論)を記述可能となる。 • ログから検証 BEL𝐽𝑜𝑎𝑐ℎ𝑖𝑚 AX ¬Do ∀𝑝𝑒𝑜𝑝𝑙𝑒 𝑒𝑥𝑐𝑒𝑝𝑡 𝐴𝑙𝑏𝑖𝑛, tell, Is who, seer → Is Albin, seer Do divine, Liesa ∩ Is Liesa, villager
  79. 79. BDI論理による推論表現 • 占い師を演じる狂人の襲撃に失敗した人狼 が、狂人を庇う村人の動きから、その村人が 狂人を護衛した狩人と見抜く
  80. 80. BEL 𝑂𝑡𝑡𝑜 (BEL 𝑀𝑜𝑙𝑖𝑡𝑧 Is Otto, VILLAGESIDE ) → BEL 𝑂𝑡𝑡𝑜 (Is(Molitz, hunter)) Is x, attacked ∩ AX(Is x, live ) → Is x, guarded Is x, VILLAGESIDE → Is x, HUMAN Do Molitz, know, Is Albin, attacked BEL 𝑀𝑜𝑙𝑖𝑡𝑧 Is Otto, HUMAN BELy Is x, VILLAGESIDE → BELy (Do y, know, Is x, attacked ) Is Albin, attacked AX(Is Albin, live ) Is Albin, guarded Is x, seer ∩ Do x, tell, Is y, HUMAN → Is x, HUMAN BEL 𝑀𝑜𝑙𝑖𝑡𝑧 Is Albin, seer Is(x, hunter) ∩ B(Is y, guarded ) ↔ Do(x, know, Is(y, attacked)) Is y, HUMAN ∩ Do x, tell, Is(x, seer) ∩ Do x, tell, Is y, HUMAN ∩ (Do ∀z except x, tell, Is(z, seer) ∩ Do z, tell, Is y, wolf ) → Is x, seer Is Otto, HUMAN Is Albin, seer 𝑩𝑬𝑳 𝑴𝒐𝒍𝒊𝒕𝒛 Is x, seer → Is x, VILLAGESIDE BEL 𝑀𝑜𝑙𝑖𝑡𝑧 Is Albin, VILLAGESIDE 𝑩𝑬𝑳 𝑶𝒕𝒕𝒐 𝑓𝑎𝑐𝑡: 事実 𝑟𝑢𝑙𝑒: 規則からの推論 estimation: 推測 𝑟𝑎𝑡𝑖𝑜𝑛𝑎𝑙 𝑎𝑐𝑡: 合理的行動 ℎ𝑒𝑢𝑟𝑖𝑠𝑡𝑖𝑐𝑠: 経験則 「占い師は嘘付かない」 「2人の占い師の一人が人間を人間と 占ったら、そいつが本物」 「オットーは人間」 「アルビンが占い師」 「占い師は人間」 「アルビンは襲撃されたが生きてた」 「襲撃されて生きてるなら護衛成功」 「アルビン護衛」 「村側なら人間」 「モーリッツがオットー村側と信じる」 「モーリッツは狩人!」 「モーリッツはアルビン人間と考えてる」 「人間と信じてるなら、たぶんその人は襲われたと知ってる」 「アルビン占い師」 「モーリッツはアルビン襲撃されたと知ってる」 「襲撃先を知ってるのは狩人だけ」
  81. 81. • 不注意な人間の行動を、それゆえに信じる
  82. 82. グランドチャレンジとしての利点 • 社会的知能(他者への推論)を要求される課題である – 相手のモデルのシミュレーション、相手の中の自分の思考のシミュ レーションが必要 – 可能世界論やBDI論理のような人工知能手法が実用化 • しかしながら、勝敗は明確である – 「良い行動」「悪い行動」の評価、フィードバックがしやすい • ルールがシンプルで、レイヤによって様々な課題を設計できる – 統計分析、発話順序、非言語、パラ言語、身体性、ジェンダー – MAS、HAI、ロボティクス、認知科学、社会学、ビデオゲーム…各人が 自分のスキルでチャレンジ可能 – また、段階的に課題の難しさを設計できる • データがあり、取っ掛かりやすい – 日本語だけなので、日本人の研究者が有利 • 応用範囲が広い – コミュニケーション教育
  83. 83. 人狼対戦サーバ • 人狼知能をエージェントとして互いに対戦可 能なサーバ • 将来的には人間との対戦も実現 人狼サーバ人狼サーバ 人狼プロ トコル 人狼 プロトコル 翻訳 モジュール 自然言語 感情表現 モジュール 人狼 プロトコル 表情
  84. 84. • 会話• 会話 • 投票 • 能力者の行動決定 • 投票 • 能力者の行動決定 • 吊り、襲撃処理 • 占、霊へ情報提供 • 勝敗処理 • 吊り、襲撃処理 • 占、霊へ情報提供 • 勝敗処理 • 会話ゲーム開始ゲーム開始 ゲーム終了ゲーム終了 人狼サーバにおけるゲームの流れ
  85. 85. 全員の話し合い全員の話し合い 会話終了会話終了 共鳴者の会話共鳴者の会話 人狼の話し合い人狼の話し合い 人狼の 話し合い 人狼の 話し合い 1日の始まり1日の始まり 話し合いに参加するエージェ ントの並び替え(ランダム) 話し合いに参加するエージェ ントの並び替え(ランダム) まだ喋 る まだ喋 る 話し合い終 了 話し合い終 了 YES NO エージェントによる発話エージェントによる発話 話し合い開 始 話し合い開 始 人狼エージェントによる 発話 人狼エージェントによる 発話 人狼サーバにおける会話の流れ
  86. 86. シンプルな人狼のモデル化 • 人狼のシンプル化 – 発話:特に必要な発話のみ • 役職のカミングアウト • 能力によって得られた情報の共有 • 疑っている対象の報告 – 疑い度:プレイヤーの状態から人狼らしさを推測 • Q学習を用いて戦略を学習 86 QQ ? !
  87. 87. 学習内容 • 襲撃,処刑等の対象選択方法 • 発話内容 • 人狼側が嘘をついて装う役職 • プレイヤーの疑い度 87
  88. 88. 人狼・学習無 人狼・学習有 人間・学習無 38.6% 22.3% 人間・学習有 52.9% 36.4% 結果(1/3) • 学習の有無による人間側の勝率の変化 戦略の学習によって 勝率の向上が得られた 88
  89. 89. 結果(2/3) • 人狼側の戦略ごとの人間側の勝率の変化 • 実データと比較して高い相関(0.766) →人間に近い戦略の学習に成功 89
  90. 90. 結果(3/3) • 上級者が用いる手法の発見 – 生き残り人数が5人の時、襲撃における最適戦略 ↓ “誰も襲わない” 高度な戦略の学習が可能であることを発見 90
  91. 91. 人狼の詳細情報はこちら http://aiwolf.org/ サーバ公開中 11/19 日吉キャンパス、横浜 人狼知能エージェント 作成セミナー (※まだ若干枠があります!)
  92. 92. 感情労働を補佐する技術としての HAI 社会的知能を応用する
  93. 93. 研究提案:HAI技術の新しい応用 • 機械の擬人化から人間の擬人化へ • 感情労働を肩代わりするためのHAI技術利用 – 人間の社会的行動の補佐
  94. 94. 感情労働とは何か? • 労働者が、他人の感情に合わせて行動する 必要がある種類の労働 [Hochschield 83] – 肉体労働・頭脳労働に並ぶ労働 – 客室乗務員・介護・教育など
  95. 95. 感情労働≒社会的な知能を要する労 働 • 高度な知能を要する課題 – 感情労働は相手のモデル化を要求する – 社会脳仮説
  96. 96. HAIでのエージェントの応用 • 感情労働の対象とする 領域と、HAI研究で提案 されてきた応用範囲が 重なる – 介護・教育・情報提示 – HAI技術は感情労働の 代替?
  97. 97. 代替としての技術・補佐としての技術
  98. 98. 部分的な自動化の利点 • 社会的応用に結びつきやすい • 市場が存在する
  99. 99. プロトタイプの提案:AgencyGlass
  100. 100. 実装とデモ • センサによるジェスチャ 拡張 • 外部カメラとの連動 – 相手の視線を追いかけ る • Joint attention
  101. 101. 反応 • 3/1: インタラクション2014デモ • 3/6: HRI 2014 video presentation • 3/10: NewScientist – 技術的な詳細が主 • 4/11: IEEE blog, 4/17: BBC – 感情労働についての記事を組む • USA, Australia, New Zealand, United Kingdom, France, German, Swiss, Spain, Russia, Sweden, PRC, Chile, Brazil, Taiwan, Israel, Vietnam, Indonesia, India • 4/22: AFP通信 – 日本のメディア
  102. 102. Youtubeのコメント • 評価 賛4:否1 • コメント – 賛14件、否10件、どちらでも ない36件 • 賛成 – 代替に賛成、感情表現が苦 手な人に良い • 否定 – 外見が不気味、こわい • どちらでもない – 日本特有?
  103. 103. 議論(1/2) • Dr. Berthouzeによる指摘 – 異種文化の表現を変換する技 術に使えるのではないか • Garciaの記事: Rappler – 文化に依存するので難しい • Huffington Postの議論 – アスペルガーや近視の人の補 助に有効 • Sanovaの記事: Think Inc. – 感情表現の代替が人間の感 情表現を減らす危険性につい て
  104. 104. 議論(2/2) • 意外に多くの需要が存在する – 感情労働は日本に限らない – 自動化は補佐に絞る • 自動化と教示のバランスに注意する

×